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"STATISTICAL METHODS 
AND 
SCIENTIFIC INFERENCE” 


SIR R. A. FISCHER 


Compte-Rendu présenté par J. R. Barra 


Examiner les bases logiques de l'analyse statistique et ses modes de 
raisonnement, tel est le but que se propose SirR.Fisher dans son dernier 
livre : ''Statistical Methods and Scientific Inference',. 


Et certes lebesoïin s'en faisait sentir; sidansl'immense développement 
des statistiques scientifiques ou appliquées l'auteur note deux époques : 
d'abord essentiellement avec Pearson et Galton l'étude mathématique des 
problèmes, puis plus récemment les essais d'expériences planifiées, ïl 
n'en affirme pas moins que laconstruction d'expériences probantes et leur 
interprétation doivent s'intégrer dans un ensemble logique et cohérent : 
notre mode d'investigation du monde réel. Il s'agit d'établir lesbases mêé- 
me du raisonnement inductif statistique, n'hésitons doncpas à assurer par- 
faitement nos étapes de raisonnement. 


Le plan suivi par Sir R. Fisher est le suivant : 


À - LA TENTATIVE DE BAYES des probabilités à priori et les critiques 
qui lui ont été faites, Pour l'auteur,ces critiques montrent que la même 
forme de raisonnement ne pourra pas être appliquée dans toutes les situa- 
tions et ilconviendra, suivant les cas, d'utiliser, soit la méthodede Bayes, 
soit un test de signification, soit ... 


B - QUELQUES FORMES GENERALES DE RAISONNEMENT : 


Le test d'une hypothèse et 1a valeur qu'il convient de lui donner, puis 
1a méthode fiduciaire d'estimation. 


C - L'étude comparée de lanotion de probabilité et du concept de vraisem- 
blance sur des exemples. 


D - Problèmes particuliers à l'estimation. 


Au cours de son ouvrage, l'auteur fait de nombreuses incidences sur 
1a notion de probabilité, tant pour remarquer la diversité de significations 
pratiques que chaque esprit lui donne, que pour justifier la méthode des 
probabilités fiduciaires. Nous analyserons ces remarques dès maintenant, 
pour apporter quelques éclaircissements à la suite. 
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I. - LA NOTION DE PROBABILITÉ 


Les points essentiels pour Sir R. Fisher semblent être les suivants : 


&æ - La définition mathématique n'est qu'un ensemble d'axiomes äutiliser 
quand nécessaire (p. 32) la théorie axiomatique n'a jamais été prise bien 
au sérieux dans les branches appliquées (p. 107). Le facteur d'incertitude 
y est inopérant (p. 109). 


- Pour appliquer les résultats mathématiques ondoit prendre certaines 
précautions:par exemple, pour qu'un joueur en expectative devant le jet 
d'un dé, soit obligé d'admettre la probabilité 1/6, il faut et il suffit qu'il 
n'ait aucune possibilité pour distinguer entre elles les épreuves futures, 
donc que son ignorance complète soit bien établie (p-32); 


Y - En remarquant le rôle de l'ignorance comme donnée, l'auteur est 
amené à critiquer la conception de Laplace de la probabilité. Renouvellant 
contre lui l'objection de confusion entrepossible et probable - et que d'ail- 
leurs tous les auteurs ne trouvent pas aussi importante - Sir R. Fisher 
estime que la définition Laplacienne de la probabilité est exprimée de telle 
façon que l'on puisse confondre les deux propositions: 


a) J'attriburai la même probabilité àun évènementaucours d'épreuves 
futures, car je ne peux rien retenir pour les distinguer. 


b) Je considérerai des hypothèses comme également probables si je 
ne peux rien retenir pour les distinguer (p. 34). 


Quand l'auteur pense à la théorie axiomatique, il semble que ce soit 
à la théorie des fonctions complètement additives d'ensemble, cependant 
on ne saurait oublier qu'avant de considérer un évènement comme élément 
d'un ensemble muni d'une loi de probabilité, on a dû, non seulement faire 
quelques abus de langage du type : confondre probabilité pour que la pro- 
position ‘'à la suite de telle épreuve l'évènement se produira!'!' soit vraie, 
avec probabilité de l'évènement par rapport à l'épreuve considérée, mais 
surtout préciser lanotion de catégorie d'épreuves, notion essentielle (Fré- 
chet ...) qui doit être mise en évidence dans tous les cas délicats et que 
l'on peut considérer comme représentative du l'facteur d'incertitude!'. 


Quant à la condition (f) n'est-elle pas aussi nécessaire à la validité 
de la probabilité mathématique elle-même? N'est-ce pas elle qui justifie 
l'assertion suivante : Si p est la probabilitéde E sur la catégorie d'épreuves 
représentée par 1 seul jet, p" est la probabilité de E;:°:;,E sur la catégorie 
d'épreuves représentée par n jets ? Autrementdit l'indépendance des épreu- 
ves. Il apparaitrait donc que les propositions (a) et(b) de (Y) ne soient pas 
comparables. (a) justifie l'indépendance des épreuves (b) est relatif à un 
mode de formation de la loi de probabilité. Et certes en ce qui concerne 
(b), comme le montreSirR.Fisher, lescritiques de Venn et Boole, doivent 
servir à éviter un usage abusif de l'ignorance. 


Ainsi les points (x) (B) (Y) prennent-ils toute leur valeur comme pré- 
cautions à prendre en calcul des probabilités mais ne pourraient infirmer 
l'image mathématique que l'on peut actuellement construire des problèmes 
probabili:tes! Mais si l'on se préoccupe de rigueur, ne doit-on pas s'as- 
treindre à ne parler de probabilité uniquement pour des éléments aléatoires? 
Cette idée avait déjà conduit M. Fréchet à proposer probabilités des hypo- 
thèses au lieu de probabilités des causes, On pourraconstater dans la suite 
qu'un tel souci évite bien des embarras. 
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Il. - LE CONCEPT DE VRAISEMBLANCE ET LE PROBLÈME STATISTIQUE 


Parallèlement à la notion de probabilité, Sir R. Fisher souligne avec 
une particulière vigueur l'importance de la notion de vraisemblance et 
même le rôle complémentaire de celle-ci par rapport à la probabilité dans 
la représentation mathématique de l'incertitude. Sir R. Fisher avait déjà 
remarquablement exprimé cecidans "Inverse probability" dans les termes : 

l'Connaissant la population nous pouvons exprimer notre connaissance 


s 


incomplète de l'échantillon à venir en termes de probabilité. 


Connaïissant l'échantillon nous pouvons exprimer notre connaissance 
incomplète de la population en termes de vraisemblance, 


L'auteur note la différence entre ces deuxconcepts quin'obéissent pas 
aux mêmes loismais quipourtantmesurenttous deuxune certaine l'croyance 
rationnelle''. Déduire de là une schématisation mathématique simple du 
problème statistique iln'ya qu'un pas, nous le ferons brièvementne serait- 
ce que pour préciser et simplifier le langage ; admettons la définition sui- 
vante : 


Soit un espace fonctionnel & de fonctions de probabilité que nous nom- 
merons Hypothèses f (fe). Il s'agit de tirer des conclusions sur %X, 
étant donnée une ‘fonction de vraisemblance sur X'', celle-ci défi- 
nie comme suit 


A tout f eX correspond une certaine population,sur toutes ces popu- 
lations est définieune même catégorie d'épreuves .Supposons que sans 
que l'on sache sur quelle population on opère on ait appliqué l'épreuve 
et soit & le résultat. On appelera vraisemblance de f,L£(f) : ''proba- 
bilité pour que l'épreuve étant appliquée à la population correspondant 
à f le résultat en soit £&'', 


On utilise quelquefois des quantités proportionnelles (vraisemblance 
relative) ou encore le logarithme de L. 


Sir R. Fisher souligne souvent au cours de son ouvrage que la notion 
de probabilité, ne sera pas toujours susceptible de traduire mathémati- 
quement l'incertitude d'une conclusion. En effet dans la définition précé- 
dente, les informations que l'on a sur Æ sont incomplètes et pourtant com - 
ment pourrait-on parler de loi de probabilité sur X puisque les éléments f 
ne sont pas aléatoires? En effet possède-t-on une catégorie d'épreuves sur 


x? 
Notons qu'en pratique : 


1° - Les données permettent de réduire X, par exemple à un espace 
fonctionnel isomorphe à R (cas paramétrique). 


2° - L'épreuve utilisée souvent est un échantillon, mais on utilise 
ensuite presque toujours une fonction T (statistique) de cet échantillon et il 
conviendra, par exemple, de savoir si T traduit bien les données expéri- 
mentales (quantité d'information). 


3° - Suivant le but poursuivi on tirera des conclusions orientées dans 
un certain sens : 


- test de signification, c'est-à-dire, choisissant un f particulier à X 
on étudie la discordance entre l'observation et ce qui aurait été observé si 
l'épreuve avait été appliquée à la population de f. 


- estimation, choix d'un À optimum, dans quel sens? etc ... 
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- processus de décision . 


Sir R. Fisher examine séparément ces diverses méthodes, sur un 
grand nombre d'exemples mais dégage particulièrement l'esprit du 


1. - TEST DE SIGNIFICATION 


Dans l'analyse que Sir R. Fisher fait de la structure d'un test de si- 
gnification deux points lui paraissent essentiels. 


A - Une vraisemblance trèspetite jouit de la même valeur psychologi- 
que qu'une probabilité très petite. 


Supposons que L (f) - fohypothèse à rejeter - soit très faible on est 
placé devant le dilemne suivant (p. 39), 


- ou bien un hasard extraordinaire a joué, 
- ou bien € n'est pas issu de la population correspondant à fo. 


Sir R, Fisher estime qu'on éprouve la même répugnance à accepter fo 
dans ces conditions qu'à escompter un évènement de probabilité égale à 
L(fo) et déclare (p. 43) : 


‘Bien qu'identifiable à une condition psychologique de rejet de l'hypo- 
thèse, le sentiment introduit par un test de signification a pour base objec- 
tive un état de probabilité ... et si L (fo) représente une mesure des fon- 
dements rationnels de refus qu'il engendre ilest pourtantévident qu'aucune 
probabilité n'est établie sur l'hypothèse elle-même!!. 


Ainsi on pourrait étendre aux vraisemblances très voisines de o, le 
sens pratique que Borel donnait aux probabilités très voisines de o. 


B - Ne pas confondre, comme le font Neymann et Pearson, test de 
signification et processus de décision, et ceci pour les raisons suivantes : 


1° -L(f.) petit entraine la quasi-certitude de se tromper avec une 
fréquence bien inférieure à L (fo). En effet si £ est issu de fo on se trompe 
avec la fréquence L (f.) et si £ n'est pas issu de f,onne se trompe pas. 
Comme un expérimentateur ne choisitpas f, d'une façon quelconque on voit 
qu'en pratique la fréquence d'évènements est très largement inférieure à 
L(fo). D'autre part pour unprocessus de décision, il faudrait connaitre les 
deux erreurs ce qui est inutile dans un test de signification puisque si l'on 
rejette f, on se préoccupe peu de la probabilité de l'accepter à tort. De 
plus ces erreurs sont subordonnées à l'espace & choisi, or celui-ci est le 
fruit de l'imagination du statisticien et n'est pas comparable à la popula- 
tion bien déterminée et ayant un sens pratique d'un processus classique 
d'acceptation. Enfin quand le test s'applique à un ensemble d'hypothèses, 
les calculs précédents ne sont strictement plus possibles. Nous noterons 
cependant qu'un effort a été fait pour remédier à ceci avec les structures 
semblables, 


2° - C'est enfin méconnaitre le caractère d'un test de signification que 
d'imposer rigidementune fréquence d'erreur. A lasuited'un test,un expé - 
rimentateur ne prend qu'une décision provisoire, jusqu'à plus ample in- 
formé, et suivant les cas se montrera plus ou moins strict sur EAtES) Et 
Sir R. Fisher s'indigne à l'idée qu'un chercheur ne soit qu'un automate 
sans responsabilité ni initiative au service d'une immense organisation à 
lois imposées. 
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Et l'auteur conclut en se défendant d'introduire des ‘'fonctions de prix 
dans les travaux scientifiques commeon doit le faire dans un processus de 
décision; car on cherche des méthodes également convaincantes à tous les 
esprits libres, indépendammentdes intentions que l'onpourrait avoir quand 
à l'utilisation du savoir obtenu!'. 


Le test de significationétant en quelque sorte l'analyseimmédiate de la 
vraisemblance, le deuxième thème de l'ouvrage de Sir R. Fisher est la 
comparaison entre la méthode fiduciaire et celle des probabilités a priori 
(Bayes) qui fournissent l'une et l'autre, dans des cas simples, une sorte 
de fonction de probabilité sur %, Est-ce justifié ? 


IV. - MÉTHODE DE BAYES 


Sir R. Fisher a déjà exposécette méthodedans ‘'Inverse probability'! : 


Supposons que la population dont est tirée l'observation ait été elle- 
même tiréeauhasardd'une super-populationde distribution connue apriori 
d'élément  (f), la distribution a posteriori est : 


Y(H)Le(s) 
Let #6 
De plus en l'absence d'information on prendra 4 uniforme. 


S'attachant plus particulièrement à la validité de cette méthode, Sir 
R. Fisher à la suite de Venn et Boole, estime que la distribution a priori 
doit correspondre à une véritable donnée. Exemple (p. 18) : 


Soient des souris noires de deux types BB et Bb satisfaisant à 
(1) BB + grise —+noire 

(II) Bb + grise—50% de grises et 50 % de noires 

(II) Bb + Bb—25% BB, 50% de Bb et 25% de grises. 


Soit une souris noire d'une portée III, avec une grise elle donne 7 
noires, est-elle BB ou Bb? 


probabilités a priori BB:1/3 Bb:2/3 
vraisemblance BB :1  Bb:1l/ 128 
10170 64 
probabilités a posteriori | BB = 11/3 F7) 126 = 65 
Fons l2/3141/128 the 
1 44/7 3#2/3%X 1/7 1298065 
La donnée : ''La souris appartient àune portéelIll'' justifie ici les pro- 


babilités a priori de 1/3 et 2/3 mais dire qu'en l'absence d'information 
elle avait les probabilités a priori de 1/2 et 1/2 reviendrait à traiter le 
problème comme si elle était issue d'une portée donnant des BB et Bb à 
50% et serait donc abusif. 

Mais ne faudrait-il pas insister sur le fait que l'esprit accepte une loi 
de probabilité sur (ici réduit à deux propositions parce que le fait d'être 
BB est évidemment aléatoire pour une souris noire issue de Ill, sur l'é- 
preuve facile à concevoir : choix d'une souris noire parmi les noires d'une 
portée III? 
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Sir R. Fisher traite des exemples, en particulier prédiction sur de 
nouvelles épreuves (Règle de Succession) mais souligne qu'on ne doit pas 
oublier - même si le paramètre a disparu du résultat - que ces déductions 
supposent la validité des probabilités a priori. 


V. - MÈTHODE FIDUCIAIRE 


A la méthode précédente Sir R. Fisher oppose sa méthode fiduciaire 
(p. 51) qui n'est valable qu'en l'absence complète de distribution a priori 
mais qui exige : 


1° - Des observations ''continues'', c'est-à-dire pratiquement suffi- 
samment précises pour être considérées comme des valeurs observées 
d'une variable continue (p. 50). 


2° - Il existe une statistique exhaustive, c'est-à-dire : 
L(f) =L(f) 
poure pour T 


Supposons encore que T soit estimationde 8 et que si T est tirée d'une 
population de paramètre 8 on ait : 


P = prob (T-<<t) = F(6, t) 


Avec F continue et monotone par rapport à 0 et t,et exposons avec Sir 
R. Fisher la méthode sur un exemple. 


Soit une source radioactive, émettant des particules à des intervalles 
de temps x, indépendants, aléatoires, distribuéesen 8 e ** dx,0inconnu. 
Mesurons n intervalles x; et posons : 


n 


ÆE di XL x; 
on a | 
L (a) =0"TT e”°xi dx = 01 e0X 7 dx; 
prenons la vraisemblance relative 
€ (8)o" e*X maximum pour 0 = À 
d'autre part la distribution de X est 


n—1 
n -&x X 
A TEE () 


d'où si l'on pose 


L=20%X+2n$ 


X a une distribution d'après (1) qui est simple et même tabulée d'où : 
quelque soit P, il existe X{P) tel que 
Prob[ X > XPp]=pP 
soit 
Prob [en $ > x2®) | = P 


z 1 V2 ; 
(Remarquons, en aparté, qu'ici X’est aléatoire sur la catégorie d'épreuves 
complexe : mesure de n intervalles), 
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Sir R. Fisher en déduit alors la proposition 
Ce £ 
Prob Lo Rs x @) | = P 


Ce qui représente à son avis une distribution sur 0 , Comme justifica- 
tion nous nous limiterons aux propres termes de Sir R, Fisher (p. 54). 


1° ‘'Dans l'égalité (1) l'ensemble de référence est l'ensemble de toutes 
les valeurs de T pouvant être obtenues pour une valeur 8 . IL, (1), a été 
démontré pour tout 8 et est ainsi applicable à tous les couples(T,@ ) obte- 
nus pourtoutes les valeurs de @ . Le couple particulier d'un expérimentateur 
appartient à cet ensemble élargi, à l'intérieur duquel la proportion des cas 
satisfaisant l'inégalité 


0> > x° (p) est égale à P"'. 


2° - p. 56 ''En conséquence il est essentiel d'introduire l'absence 
d'information a prioricomme une donnée distincte pour démontrer complè- 
tement l'applicabilité de la méthode fiduciaire de raisonnement aux cas 
particuliers expérimentaux auxquels elle est appliquée, 
Sir R. Fisher note plus loin qu'avec les notations du début-$E dT est 
dF 


la vraisemblance de 0 et - a 1€ la ''distribution fiduciaire!'' élémentaire 


de 8; et enfin précise qu'il ne faut pas confondre les résultats issus de la 
l'distribution fiduciaire'' avec les limites de tolérance. 


Nous nous limiterons à indiquer les exemples largement traités par 
Sir R. Fisher en application des deux méthodes précédentes. 


- étude d'un''échantillonnormal'' paramètresinconnus/{p.78) distribu- 
tion de tet z, 


- un cas de régression linéaire (p. 82), 


- prédiction fiduciaire et Bayesanne (p. 111 à 121) et encore de nom- 
breux autres. 


Enfin dans son dernier chapitre Sir R,. Fisher traite de la: 


V. - THÉORIE DE L’ESTIMATION 


Rappelant ses travaux précédents l'auteur précise quelques notions 
particulières à cettebranche des statistiques : c'est-à-dire comment cons- 
truire une statistique - définie à partir des observations - qui puisse être 
considérée comme une estimation satisfaisante. 3 notions essentielles, 


À - CRITERE DE CONSISTANCE 
Remarquons d'abord que si T estime 0, f(T) doit estimer f(0) d'où 
rejeter la condition de non-biaisage. 
Ensuite si T(ai) est une estimation de æ(A;) 
ai observations 


0; paramètres 


T_ (ai) = g (0i) défini une estimation consistante. 
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Sir R. Fisher montreque cette définition est meilleure que la conver- 
gence en probabilité de T—>@ cas si: 


Test une statistique quelconque définie pour N,observations, 
T', est une statistique asymptotiquement consistante, toujours définie. 


1 
NON TK, + (N-N1) Twin, ) 


satisfait à la condition asymptotique mais coincide avec Th,» pour N = N;. 


B - CRITERE D'EFFICACITE 


La première définition donnée fut asymptotique. Soit T une statistique 
dont la distribution devientnormale si l'effectif n de l'échantillontend vers 
l'infini, V(T)la variance de T. 


Si nV(T) à une limite minimum T est efficace. 


Un souci semblable pour des échantillons finis a conduit au critère de 
suffisance et à utiliser : 


C - QUANTITE D'INFORMATION 


T traduit-il bien toute l'information contenue dans l'échantillon en vue 
de p(6;i) à estimer ? Cette question estrésolue par la quantité d'information 
de Sir R. Fisher qui ici examine plus particulièrement le problème des 
statistiques (ou de l'information) subsidiaires etinsiste encore sur l'impor- 
tance de la vraisemblance dans tous ces problèmes. 


PROBABILITÉ SUR UN TREILLIS 
NON MODULAIRE 


(Calcul quantique des probabilités) 
par 


G. BODIOU 


A. - BUTS ET RÉSULTATS DE CE MÉMOIRE 


1°) Rappelons d'abord quelques caractères du formalisme quantique : 


À tout vecteur unitaire, W , d'un espace deHilbert, H, correspond une 
pondération des multiplicités linéaires ferméesou m.l.f deH,telles que À, 
par : 

2 
P(A/Y) = || E(A)Y |”, où E(A) est l'opérateur de projection orthogonale 
sur À, 

On prend aussi en considération une pondération conditionnée par la 
m.l.f.B et définie par : 

2 2 
P(A/B,w) = P(A/E(B)Y )=|| E(A).E(B).w|| /|lE(B)w|| 

Ces définitions ne dépendent que de la multiplicité d'ordre 1 qui sup- 
porte Y et tout le formalisme se définit en termes du treillis des multipli- 
cités linéaires fermées de H, ou treillis (m.1.f). 

Cette pondération quantique n'estune probabilité classique que sur des 
sous treillis particuliers de (m.1.f). En effet : 

a) An B= fn'implique pas P(AU B/Y) = P(A/Y) + P(B/Y), c'est-à- 
dire que le principe des probabilités totales n'est pas vérifié par la pondé- 
ration quantique. 

b) Comme E(A). E(B) Z E(AN B) (sauf si E(A) et E(B) commutent) le 
principe des probabilités composées n'est pas vérifié par les pondérations 
conditionnées quantiques. On interprète, d'un point de vue classique cette 
non-vérification en considérant que le ‘'conditionnement quantique'' est, en 
réalité, un ''changement de catégorie d'épreuves". Il faut cependant cons- 
tater que, s'il en est ainsi, leformalisme quantique établit ,entre catégories 
distinctes d'épreuves, par sapondérationconditionnée, un lien ignoré des 
classiques. 

c) On peut montrer que l'impossibilité de définir sur (m.1.f) une proba- 
bilité classique est impliquée par la structure de ce treillis. 

Ce treillis estnon-modulaire:c'est-à-dire que, sur lui, on peut avoir, 
à la fois : 

A C et AU (BN C)#(AU B)N C; (voir (1). 
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alors que, sur un treillis modulaire : 
AZ C—AU (BNC)=(AU B)N C ; (—> marque l'implication) 
- Cette dernière relation exprime une distributivité restreinte, la dis- 
tributivité générale s'exprimant par : 
AU {B.N C) = (AU.B).N (A UE). 


Or, si un treillis supporte une probabilité classique, P(A), cette pro- 
babilité satisfait à la l'relation modulaire! : 


P(x) + P(y) = P(xUy) + P(xN y), 
d'où l'on déduit aisément : P(AU (BN C))=P((AU B)N C), quandA< C; 
et comme, terme à terme : AU (BN C) (AU B)N C,ona : 

P((AU B) GA (BA C)) = 0, 
pour toute loi de probabilité classique sur ce treillis. 


Si l'on impose, alors, à ce treillis, d'être telqu'il n'y aitque le mino- 
rant universel, f , dont la probabilité soit nulle pour toute loi, ce qui est 
vérifié par la pondération quantique sur (m .1.f) etpar lesprobabilités clas- 
siques , il suit de la relation précédente que : 


(A U Bee AUnE MRC) =0, 


c'est-à-dire que le treillis estnécessairementmodulaire ,(m.l1.f), qui n'est 
pas modulaire, ne peut donc supporter une telle probabilité. 


2°) Notre but est d'affaiblir convenablement lesconditions imposées au 
calcul classique des probabilités pour que le support du nouveau calcul 
puisse être un treillis non-modulaire, tout en sauvegardant lesnotions pro- 
babilistes fondamentales : probabilités totales, probabilités conditionnelles, 
variables aléatoires, fonctions de répartition, indépendance, lois des grands 
nombres ... 


Le treillis que nous décrivons est plus général que le treillis (m.1.f). 
Son immersion dans ce dernier est rendue possible par des axiomes sup- 
plémentaires dont le plus caractéristique est que tout élément du treillis 
est l'union d'un ensemble d'atomes dont la puissance est, au plus, infinie 
dénombrable, Mais ces restrictions sontartificielles et le formalismepro- 
babiliste quantique peut être effectivement généralisé. 


La trace du calcul élargi sur les sous-treillis booléens du treillis total 
est un calcul ciassique,. 


L'une des interprétations possibles du formalisme ainsi construit est 
la suivante : 


L'ensemble des propositions expérimentales relatives à un système 
matériel donné est réparti en systèmes hypothético-déductifs : ce sont les 
divers treillis de certitudes, L'ensemble, supposé complet, des axiomes 
de l'un de ces systèmes étant symbolisé par son atome de base. 


L'affirmation de vérité de l'un de ces systèmes se traduit par l'at- 
tribution de la probabilité 1 à son atome de base, et, par suite à tous ses 
éléments. 


Une telle affirmation de vérité détermine la probabilité de toutes les 
propositions expérimentales, 


Le conditionnement s'interprète alors comme suit : L'affirmation de 


vérité d'une proposition expérimentalen'appartenantpas ausystème déductif 
qui fixe la loi de probabilité, implique le remplacement de ce système par 
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celui, parmiceux auxquels appartient laproposition considérée, dont la base 
axiomatique est la plus probable dans la pondération initiale, 


Le calcul des probabilités généralisé serait une théorie de la pondéra- 
tion relative des systèmes hypothético-déductifs les uns par les autres, 


Conclusion : Quel que soit l'aboutissement des travaux actuellement en 
cours pour atteindre une réalité plus profonde que celle que décrit la sta- 


s 


tistique quantique, cette statistique restera valable à son niveau propre. 


Nous sommes convaincus qu'elle impliqueune généralisationfructueuse 
de la notion même de probabilité. 


B. - PROBABILITÉS SUR UN TREILLIS NON-MODULAIRE 


La consistance des axiomes est assurée par leur vérification sur 
(m.1.f). Leur indépendance n'est pas démontrée. 


Les preuves des théorèmes et quelques vérifications d'axiomes sur 
(m.1.f) ont été reportées à la fin du mémoire, afin de mieux dégager les 
caractères essentiels du formalisme, 


Les axiomes sont notés:A .,.., lesdéfinitions : D ..., les théorèmes : 


Th ...; ceux d'entre eux dont la démonstration, ou quelque commentaire à 
leur sujet, figure en fin de mémoire, sont soulignés : A, D, Th. 


I. TREILLIS ORTHOGONAL T. 


T admet un élément nul, , et un élémentuniversel, u. Sur T est défi- 
nie une complémentation, A—>A!, dite orthocomplémentation parce qu'on 
lui impose la propriété : A B— A! => B' ; cette orthocomplémentation 
définit sur T un isomorphisme dual involutif bien connu; on suppose aussi 
T relativement complémenté et si A B, on note le complément relatif de 
A à B par B-A. Enfin T est complet, c'est-à-dire que tout ensemble d'élé- 
ments admet un minorant commun et un majorant commun. 


II. VALUATION GENERALISEE SURT ; ECART INDUIT SUR LES CHAINES 
PAR CETTE VALUATION. 


DVI). Une valuation généralisée, V(A), est une applicationdes éléments 
du treillis sur le corps des complexes, satisfaisant à l'axiome : 


AVI). A< B'—=V(AU B) = V(A) + V(B) (''valuations totales''); on en 
déduit que V(#) = 0. 


ThV1). Surune chaine de T, les nombres : e(A,B) = | v(B-A)| définissent 
un écart, qui est dit ‘induit par la valuation V(A)'". 

III. PROBABILITE (OU LOI DE PROBABILITE), P(A), sur T. 

DP1.P(A) est une valuation réelle, positive, normée, sur T, 


Commentaire : La probabilité quantique se définiten spécifiantune valuation 
sur un treillis orthogonalisé complet comme la probabilité classique se 
définit en spécifiant une mesure sur un corps de Borel d'ensembles, 
On peut la décrire directement par les axiomes : P(A) réel, P(A)=>0, 
P(u) = 1, A&B'—=P(AUB) = P(A) + P(B). 


Une P(A) est identique à l'écart qu'elle induit sur les chaines, 


Thpl1) L'équivalence de l'axiome des probabilités totales quantiques à 
l'axiome classique estcondition nécessaireet suffisante pour queT 


soit booléen. 
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Commentaire : Sur un treillis npn-booléen l'axiome quantique des probabi- 
lités totales est plus faible que l'axiome classique dont l'hypothèse, 
ANB=#, est impliquée par A< B', mais ne l'implique pas. 

ThP2) MvA;< A}; pour ti Z j,iet j appartenant àun ensemble finid'indites 

JPA) = 3 PÜAi). 
1E 


AP1). ThPZestvraisiJ est unensemble indéfini dénombrable:o-additivité. 
ThP3). A&B=P(A)<P(B) : P(A)est non-décroissante. 

IV.TREILLIS DE CERTITUDES D'UNE LOI DE PROBABILITE QUANTIQUE 
ThRTCI) L'ensembie des éléments, A, de T, tels que P(A) = 1, est fermé 


pour U. 
ATCI) L'ensemble des éléments, A, de T, tels que P(A) = 1, est fermé 
pour f. 


DTCI1) Cet ensemble, qui estdoncun sous-treillisdeT, s'appelle "treillis 
de certitudes'' de la loi P(A). On le note : TC(P). 


ThTC2) ATCI<—/|(P(A) = 0 et P(B) = 0)—(P(AUB) = 0)]. 

Commentaire : Sur un treillis de Boole, ATC I estunthéorèmeimpliquépar 
la relation modulaire. Sur T, ATCI est un axiome indépendant de ceux 
déjà admis. . 

ThTC3) Tout treillis de certitudes a un élément minimum, z(P), dit ‘base 

de la loi P(A)''. (car T est complet). 

ThTC4) TC(E) est identique au treillis des majorants de z(P). 


ATC2) Tout élément de T autre que # appartient à un treillis de certi- 
tudes. 


ATC3) Tout treillis de certitudes est ''déductivement complet'!', c'est-à- 
dire au sens où l'on dit qu'un système d'axiomes est complet : Un 
treillis de certitudes ne peut être sous-treillis d'un autre treillis 
de certitudes. 


ThTC5) z(P) > #, ou : les bases de lois sont des atomes. 


ThTC6) z(P) définit une applicationunivoque des lois sur lesatomes;c'est- 
à-dire : z(P) est unique. 


ThTC7) T est atomique; c'est-à-dire : tout élément est minoré par un 
atome. 


ThTC8) Les relations Z > @, P(z)= 1, définissent une application des ato- 
mes sur les lois, 


ThTC9) Si A et B sont des unions d'atomes ; P(A) = P(B), pour toute loi, 
implique : A = B. 


DTC2) Siz=z(P), on notera : P(A) = P(A/2). 
ThTCI10)T satisfait à la loi de couverture : (Z > @ et zSA)—zUAY À. 


ATC4) L'application des atomes sur les lois est univoque . C'est-à-dire 
que, z étant donné, il n'y a qu'une loi telle que : P(z)= 1. 


ThTCI11)I1 y a correspondance biunivoque entre les lois et leurs treillis de 
certitudes (ou entre les lois et les atomes). 


Commentaire : ThTC11 n'est pas vérifié par les P classiques. 
L'interprétation logique de ThTCIll paraitra satisfaisante à ceux qui 
pensent qu'une loi de probabilité doit être déterminée par un ensemble 
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de propositions constituant une donnée préalable. 

On peut considérer que le ‘treillis de certitudes'' formalise la 
notion classique de ''catégorie d'épreuves'' ou la notion quantique de 
l'programmes de mesures!!, 


V. PROBABILITES CONDITIONNELLES, 


ThPCI1) A étant un élément de T,sur le treillis orthogonal des B,minorants 
de À, pour lequel À est élément universel, et pour toute loi surT, 
telle que P(A/z) + 0, la fonction : 


P, () = 2fR7s A 


est une loi quantique; c'est-à-dire qu'elle satisfait à DPI. 


DPCI) P;(BJest dite ;trace de la loi P(B/z) sur le treillis des minorants 
de A. 


ThPC2) z S A'—(z U A!')N A est un atome. 


DPC2) Pour tout atome z on pose : (z U A') M A = E(A) z =projection 
orthogonale de l'atome z sur l'élément A. (c'est un atome pour 
z<A!' ; c'est À pour z< A'). 


ThPC3) z$A'—>A = E(A)z U (z'N A), 
ThPC4) Quelque soit l'atome z : P(A/z) = P(E(A)z/z). 


Commentaire : ThPC4 réduit la donnée de toutes les lois à celle d'une 
fonction, P(x/y), des couples d'atomes. 


ThPC5) Le treillis des certitudes de la loi P,(B) contient l'atome E(A)z. 
APCI) P,(B) satisfait à ATC3. 


ThPCé) P,(B) est (sur le treillis des minorantsde(A)la loi déterminée par 
l'atome E(A)z : P,(B) = P (B/E(A)z). 

DPC3) Nous appelons''loi conditionnée par A'', etnotons P(X/A,z), quand 
la loi initiale sur T est telle que P(A/z) # 0, l'extension, autreil- 


lis total T, de la trace de la loi initiale sur le treillis des mino- 

rants de A. On a donc : P(X/A,z) = P(X/E(A)z). 

Commentaire : Si l'on applique la définition DPC3 en calcul classique, en 
utilisant, pour tout élément X du corps de Borel (ou du treillis de 
Boole) la décomposition (impossible sur T) : X = (XN A)U (XN A!), 
on trouve l'expression classique des probabilités conditionnées 
P(X/ A) = P(XN A/A) = P(XN A)/P(A). 

Mais, par suite de la détermination des lois quantiques par leur 
treillis de certitudes, DPC3 définit la transformation de la loi pour 
certaines transformations de ce treillis (ou du point de vue de la phy- 
sique quantique pour certaines transformations du ‘programme de 
mesures!')., Il n'existe rien d'analogue encalculclassique lors duchan- 
gement de la catégorie d'épreuves. 

Interprétation logique de ce qui précède 
Nous interprétons l'ensemble des éléments de T comme un ensemble 

de propositions. 

Les opérations U et N sur T seront interprétées comme étantrespec- 
tivement la disjonction logique ‘'ou'' et la conjonction logique ''et''; l'opéra- 
tion de complémentation sera interprétée comme étant l'opération logique 
de négation. 
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La relation d'ordre sur T doit être interprétée comme étantun prédicat 
de la logique (nous rappelons que l'implication logique, a Db, n'est pas un 
prédicat maisune opération, parfois définie par a! U b).Leprédicat logique 
est un prédicat ''unaire'', c'est-à-dire à un seul argument, pour certains 
auteurs (+— a signifiant que a peut être prouvé) mais il peut être un prédi- 
cat binaire pour d'autres(13, ChV), at—b s'interprétant alors par best 
déductible à partir de a!', avec les propriétés : 


a H—a, réflexivité, et : (a-— betbt— c)j—at- c, transitivité. 
Ces propriétés sont celles de la relation d'ordre sur T : ab. 


On s'assure que les relations fondamentales sur T entre les opérations 
et l'ordre sont vérifiées par les opérations logiques et la déductivité : 


(acetb=c) albec,équivaut à: (at cetbt- c)—Ha oubt— c 
(ab etazc) —a<b c,équivautà:(a+—betat- c)—at—betc. 


Un treillis de certitudes est l'ensemble des propositions déductibles 
de la proposition atomique z qui joue le rôle de base axiomatique d'un sys- 
tème déductif. 


ATC3 exprime que ces systèmes déductifs sontcomplets au sens habi- 
tuel en axiomatique. 


ThTCI11 exprime que l'attribution, à la base de l'un des systèmes, de 
la probabilité 1, c'est-à-dire l'affirmation de sa vérité, détermine la pro- 
babilité de toute proposition de l'ensemble. 


Le ‘'conditionnement quantique'', par l'affirmation de la vérité de A, 
s'exprime par le passage de la loi déterminée par la base z à la loi déter- 
minée par la base E(A) z 


Or E(A)z A et, pour la loi initiale : P(E(A)z/z) = P(A/z2). 


E(A)z étant le seul atome, parmi ceux qui minorent A, jouissantde 
cette propriété ; pour tout autre x, tel que x A, on a : P(x/z)<CP(A/2) 
(inégalité stricte). 


On peut donc dire que leconditionnement quantique, par A, consiste en 
un changement de base axiomatique, le nouvelle base étant, pour la loi 
initiale, la plus probable de celles desquelles on peut déduire A. 


VI. RELATIONS ENTRE LA STRUCTURE DE T ET L'AXIOME DES PRO- 
BABILITES COMPOSEES 


AC 1) Tout élément de T est une union d'atomes. 


ThCI1) Pour que T soit Booléen (c'est-à-diredistributif) il faut etil suffit 
que les probabilités quantiques satisfassent à l'axiome des pro- 
babilités composées. 


P(B/A,z).P(A/7z) = P(ANB/ 2). 
DCI). Pour z&A!', nous poserons : 
P(B/A,z).P(A/z)=PP(A.B/z) = pseudo-probabilité du couple ordon- 
né,ou séquence, A,B. Pour zA!', nous poserons: PP(A.B/z)= 0. 
Remarque : on peut énoncer ThCI1 sous la forme : Pour que T soit booléen 
il faut et suffit que les pseudo-probabilités de séquence soient des 
probabilités d'intersections : PP(A.B/z) = P(ANB/2) 


CZ Pour que T soit booléen il faut et il suffitque les PP satisfassent, 
pour tout couple, A,B, à la condition : 


ThC3) 


ThC4 
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z<B—PP(A,B/7z) + PP(A'.B/z)= 1. 


Pour que T soit booléen, il faut et il suffitque les PP satisfassent 
à l'axiome quantique des probabilités totales quand le premier 
terme de la séquence décrit T. (D'après leur définition les PP 
satisfont à cet axiome quand le second termede la séquencedécrit 
T; la nécessité est immédiate, et ThC2 est un cas particulier de 
ThC3: 


Pour que T soit booléen il faut et il suffit que les PP soient fonc- 
tions symétriques des termes de la séquence : PP(A.B/7z) = 
PP(B.A/7z). 


Commentaire : Les PP qui sont, à la fois, une valuation et un écart sur 


les chaines décrites par leur second terme gardent ce caractère 
sur les chaines décrites par leur premier terme si, et seulement 
si, elles satisfont à l'axiome des probabilités composées. Le 
treillis T est alors booléen. 


VII. AFFAIBLISSEMENT DE L'AXIOME DES PROBABILITES COMPOSEES 


Commentaire : Si l'on veut préserver, pour T, la possibilité d'une struc- 


> 


ture plus faible que celle des treillis booléens, et si, cependant, 
on veut conserver un lienentre lespseudo-probabilitésde séquen- 
ces et la structure du treillis T, il faut ''affaiblir'' les caractères 
l'valuation'' et ''écart'' de ces PP sur les chaines décrites par le 
premier terme de la séquence. Cet affaiblissement constitue un 
affaiblissement de l'axiome des probabilités composées, Quant au 
caractère l'écart'', on l'affaiblira en supposant seulement une 
relation bi-univoque entre les PP et un écart, par exemple par le 
postulat suivant : 


La racine carréedes pseudo-probabilitésde séquences estun écart 
sur les chaines décrites par le premier terme de la séquence : 
A,< A!'—> | PP(A,, B/z) = e((A;UA), A). 


A,<A'=—|PP(A,.B/z)+ PP(A.B/z) -PP((A,U A).B/2)| < 
2VPP(A.B/ z). PP(A,B/2z), 


conséquence immédiate de la relation triangulaire, et qui, rem- 
plaçant la''relationdesvaluations totales'', montre que AI implique 
un l'affaiblissement'' du caractère valuation des PP. 


VIII. SPECIFICATION DU TREILLIS TENVUEDE SON IMMERSION DANS 
(mi lf) 


Al3) 
ThIl) 


AI4) 


L'écart dont il est question dans Al est, quand le second terme 
de la séquence est un atome, induit par une valuation : 


VPP(A.x/y) = | V(A.x/ y)| 

Pour trois atomes, on a : V(y,x/z) = V(u.x/y).V(u.y/z). (A12 
est déjà assurée en module par DPC2 et DCI; il se réduit donc à 
une hypothèse sur les arguments). 


V(u.x/y) = V(u.y/x). (Symétrie hermitienne de la valuation). 
p(x/ y) = P(y/x). | 
(symétrie de la fonction universelle des couples d'atomes envisa- 
gée dans le commentaire de ThPC4). 


Tout élément de T est une union d'atomes en nombre fini ou en 
infinité dénombrable : À =U xj, I étant un ensemble fini ou infini 
dénombrable d'indices. . 
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ThI2) On peut supposer les atomes Xi de Al4 oxrthogonaux deux à deux; 
leur ensemble {xi) sera dit ‘'constituer une base'' de A. 


VY (z) = application des atomes, z, de T, sur le vecteur, Ÿ , de 
DI1) PP < RE OR PRET 
l'espace euclidien complexe, H, à nombre fini ou infinité dénom- 
brable de dimensions, défini par ses coordonnées : 
Y.(z) = V(u.z;/2) s { zi | étant une base de u. 
sal 


Th13) lY; (z)l= PP(u.zi/z)= P(z;/z). D'où : lE(z;) | = Di; 
Thl4) Z lp (2) |° = P(u/z) = 1. (Le vecteur Y (z) est unitaire). 
'é 


Th15)  {(V(y), # (2) =| 2 V(u.zi/y).V(u.zi/2)À P(y/2); (par A13 et 
A2): | 


DI2) a(Y ) application de tout vecteur unitaire, W , de H, sur la nn LE 
de dimension 1, a, que W détermine. 


D13) Si {xi} , pour jeJ, est une base de A, élément de T, on pose : 
NE D. f(x;), qui définit l'application d'un élément quelconque, 
je 


A, de T, dans (m.l1.f); f(z) = a(Y (z)). 
Thié) L'application f(A) invarie l'ordre : A<B<f(A)<f(B). 


Th17) f(A) est indépendante de la base choisie dans A pour appliquer 
DIS 


Th18) f(A) invarie la complémentation : f(A') = (f(A))'. 
ThI9) f(A) invarie l'union : f(AUB) = f(A)Uf(B). 
Th110) f(A) invarie l'intersection. 
LI 
Thlll  f(A) réalise l'immersion du treillis T dans le treillis (m.1.f) des 
multiplicités linéaires fermées d'un espace euclidien ayant, au 
plus, une infinité dénombrable de dimensions (Espace de Hilbert). 
IX. VARIABLES ALEFATOIRES ET FONCTIONS DE REPARTITION. 
Les axiomes des VIlet VIII ne jouent aucun rôle dans ce IX. 


DVAI) Une variable aléatoire, x, à unedimension, estune application de 
lachaine des demi-droites ]-w ,X[ dansT, notée x{] -œo, X[ ), 
ou, abréviativement, x{X), et satisfaisant aux axiomes : 


AVAI) Cette application invarie la structure de chaine : 
KE Xo => x(X1) << x(X;). 


AVA2) x(-o)= #0 et x(+o)=u,. 

AVA3) Cette application est continue à gauche, pour toute loi : 
X'1 X—P(x(X')/z) À P(x(X)/z). 
pour tout atome z. 


DVA2) Fonction de répartition, f(X), de la v.a.x pour une loi quantique 
donnée sur T, P(A/z) : 


f(X) = P(x(X)/2). 


ThVAI) f(X) est non-négative, non-décroissante, continue à gauche, f(-œ )= 
0, f(+w)=1. C'est-à-dire f(X) est une f.r. classique. 


Commentaire : Les projecteurs sur les x(X), que nous noteronsE(X), sont 
la généralisation des ‘'décompositions de l'unité! de M.J. von 
Neumann (2) auxquelles ils se réduisent quand on prend pour T le 
treillis (m.l.f). Les opérateurs''hypermaximaux!'' queces décom- 
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positions de l'unité permettent de définir, pourraient être dits, à 
bon droit, opérateurs ‘'à variable aléatoire liée''. Or ces opéra- 
teurs ont été introduits afin d'étendre le champ de résolubilité du 
problème du spectre etilest tout à fait remarquable que cette exten- 
sion soit solidaire de la prise enconsidération, pour un but pure- 
ment mathématique, en dehors de toute hypothèse physique, de 
variables aléatoires, notionessentielle au calcul desprobabilités. 


DVA3) La chaine : s(]-w, X[)ou s(X), sera dite : ‘Chaine spectrale!!, 


DVA4) Application des segments [x; ; CL sur les compléments relatifs 
d'une chaine spectrale : 


X([X1,Xo[) = x(]-œ,X20) - x( ]-œ ,X:[) = x(X2) - x(X1). 
ThVA2) L'application x([ X;, X,[) invarie l'intersection : 

x((LX:, XL NAIL 2 X£ )) = PA 1 ve XL )N (EX XaL 1 
ThVA3) L'application x([ X:, X2{[ ) invarie la complémentation : 

x((Cxi, XL) = (x(Cxs, XD)'. 
ThVA4) L'application x([ X,, X,{ ) invarie l'union. 


ThVA4') La continuité à gauche permet d'étendre ThVA4 à l'union dénom- 
brable,. 


DVA5) Le treillis booléen défini par l'application, déduite de ce qui pré- 
cède, dans T, du treillis des ensembles mesurables sur la droite 
réelle, sera dit : ‘treillis spectral! de la v.a.x, et noté S(x). 


DVA6) Variables aléatoires ''indépendantes'', 


AeS(x) et BeS(y)=P(B/A,z)=P(B/z) et P(A/B,z)=P(A/2), pour 
tout 7. 


ThVA5) Si x et y sont des v.a indépendantes, le sous treillis de T consti- 
tué par l'ensemble des éléments obtenus par union et intersection 
à partir de ceux de S(x) et de S(y) est un treillis de Boole, 


Commentaire : Il n'y a donc pas de théorie proprement quantique des va- 
riables indépendantes, Les résultats classiques qui leur sont 
relatifs sont incorporés dans la théorie quantique; il en est ainsi, 
en particulier, de la théorie des fréquences etdes lois desgrands 
nombres. 


C. - DÉMONSTRATIONS DE THÉORÈMES 
- VÉRIFICATIONS D’AXIOMES SUR (m.l.f.) 


Nous omettrons celles decesdémonstrations ou vérifications qui sont, 
soit immédiates, soit connues par une des théories utilisées (treillis, 
espace de Hilbert). 


ThP1) Pour cette équivalence, il faut et suffit que l'on ait : 


An B=#—> A<B!', (voir commentaire), pour tout couple A,B. Sup- 
posons cette condition satisfaite : 


Or : A=(ANB)U (A-(AN B)); 

Mais : [A-(AN B)<Aet(A-(AN B)}nN(AN B)-#]—(A-(AN B))nB= 6 
donc : (A-(AN B)< B'; puis : (A-(ANB))< AN B'. 

d'où : A&(AN B)U (AN B!'). 

Mais, terme à terme : (AN B)U (AN B')<A; 

Donc : A=(AN B)U (AN B');et,pardualité: A' =(A'U B')A (A'UB). 
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Ceci est un cas particulier de distributivité, qui implique la distribu- 
tivité générale; En effet : 


posons:X=A 1 (BUC),et:Y= (ANB) U (ANC); terme à terme : Y<X. 
Or : X-Y<X et X-Y<Y' = (A'UB')N (A'UC!); 

D'où : X-Y<AN(BUC)N(A'U B'M(A'UC'); si, donc : A = (AUB)N(AUB"), 
et B' = (AUB')N(A'UB') il vient : 

X - Y<(AUB)N(BUC)nB'n (A'UC')}<B' ; et de même : X - Y<C'; 
d'où : X - YEB'N C!' = (BUC)' ; or X- Y<BUC ; donc:: X -0Y =10. 
C'est-à-dire : AN(BUC) = (ANB)(ANC). 


L'hypothèse d'équivalence des axiomes classique etquantique implique 
donc la distributivité de T ; T est alors distributif et complémenté, c'est- 
à-dire Booléen, Réciproquement, si T est booléen, sa distributivité im- 
plique immédiatement que ANB = Ü—>A<B', c'est-à-dire l'équivalence 
des axiomes,. 


ThTC6) z, = z(P) et z, = z(P) et z, # z, = P(z,) = 1 et P(z;) = 1 
—> P(z,h 2,) = 1=P(6) = 1 ce qui est absurde. Donc : z, = z:. 


ThTC10)Démontrons que, si z > et z Æ A, l'existence &'une chaine : 
A<B<AUz, est contradictoire (inégalités strictes). 


On aurait alors : AU z = AU (B-A) U ((AUz)-B), les trois termes 
de cette union étant, deux à deux, orthogonaux. 


donc : P(AUz) = P(A)+P(B-A)+P((AUz)-B)= P(A)+P((B-A)U((AUz}B)). 


Soit x un atome appartenant à (B-A)U((AUz)-B). Pour la loi déterminée 
par x le dernier terme des relations précédentes est égal à 1; il est donc 
impossible que P(z/x)= 0, sinon, par ThTC2 le premier terme serait nul. 
Donc, para h TO ton as 


((B-A)U((AUz)-B))n z' = 0; donc : ((B-A)U((AUz)-B))U z'>z', 
L'inégalité étant stricte.Mais u yÿz'; donc : ((B-A)U((AUz)-B))Uz' = u 
et : ((B-A)U((AUz)-B)}Uz' » 2! ; donc : ((B-A)U((AUz)-B)) est un atome, 
ce qui est contradictoire avec le fait qu'il est une union de deux termes 
orthogonaux. 
ThPC2) zUA'}> A! —=- (zUA!)N A > A'N A'= 0. 
ThPC3) La relation : A = E(A)zU(z'N A) est immédiate si E(A)z = À. 


Si E(A)z # A,posons:A-E(A)z=B.On a : BX A. Mais, de zUA! » A', 
on déduit.z' N A A. Donc : B = z'N A, ou bien À = BU(z'NA). Or la 
seconde éventualité est exclue car : B&(E(A)z)' = (z'N A)UA'—=BU(z'N0 A}< 
(z'N AJUA!', ce qui, si cette seconde éventualité était vraie, deviendrait : 
A (z'NA)UA'SS (z'N A)UA' =((z'N A)UA')UA zu <> (zUA')NA = D, ce qui 
est exclu. Donc c'est la première éventualité qui est vraie : B = z'NA=- 
A = E(A})zU(z'N A). ThPC3 reste vrai si z<A!',. 


ThCI) La condition est nécessaire : Sur un treillis booléen : 
Bu=u(AN B)U(AINEB). d'où » P(B/A;7z) =uP(ANB/A,z)+2:F(AINB/A;2)e 
P(ANB/E(A)z) + P(A'NB/E(A)z) = P(ANB/E(A)z), et, comme ANB appar- 


tient autreillis des minorants de À , par ThPC6 : P(ANB/E(A)z) = P,(ANB)= 
P(ANB/z)/P(A/z), c.q.f.d. 


La condition est suffisante : 


si elle estsatisfaite, ona ; pour toutcouple A ,B : P((ANB)U(ANB!')/z) = 
P(ANB)/z) + P(ANB'/2) = (P(B/A,z) + P(B'/A,z))P(A/z) = P(A/2), 


PROBABILITÉ SUR UN TREILLIS NON MODUILAIRE 21 


pour tout z.Donc, par ACI1 et ThTC9 : (ANB)U(ANB!') = A, Ce qui implique 
la distributivité, comme on l'a vu au ThP1. 


ThC2) Si T est booléen, par ThCl : 
PP(A.B/z) + PP(A'.B/z)=P(ANB/z)+P(A'NB/z) =P(B/z) =1, si z<B. 
Réciproquement : 
z soie z)P(A/z)+P(B/E(A')z)P(A!/2) P(A/z)+P(A!'/2) 
<= P(B'/E(A)z)P(A/z)+P(B'/E(A')z)P(A'/2)= 0 


es D Ne (A/z) = 0 et P(B'/E(A!')z)P(A%) - 
<—+ (z< A! ou E(A) z<B) et (z< A ou E(A') z <B) 
<> (z<A etE(A)z<B)ou(E(A')}z<B et z<A')ou(E(A)z<B et E(A')z<B) 


— (z< ANB) ou (z<A'NB) ou ((E(A)zUE(A')z}<(ANB)U(A'N B)). 


Mais : z<E(A)zUE(A')z, par ThPC4. D'où l'on déduit que chacun des 
termes de la dernière disjonction triple implique : 


z(ANB)U(A'NB), pour tout z<B; donc, par ACI : 
B< (ANB)U(A'N B), d'où ladistributivité suitcomme plushaut (ThP1). 


ThC4) 


Th1é) 


Th18) 


Th19) 


La condition : PP(A.B/z) = PP(B.A/z2), est nécessaire pour que 
T soit booléen, puisque, dans ce cas, d'après ThCIl, chacun des 
termes est égalà P(ANB/z). 


Réciproquement, si PP(A.B/z) = PP(B.A/7z), le ThC2 s'applique 
immédiatement par le second membre. 


Si z est un atome de T, f(z) est un atome de (m.1.f) et l'on a : 
P(A/z) = 2 P(X;/2) = 2 P(f(x;j)/{(z)) = P({(A)/f(z)). 

D'où z<AP(A/ z) = 1=—1{(z)< f(A). 

Or : A£<B<=Xx;<B, pour tout j——>f(x;)<f(B)=>f(A)}<(B). 
donc : z<A!'=—f(z)< f(A!). 

Mais d'autre part ; z<A'<=P(A/ 2) = 0<—#(z)< (f(A))'. 
d'où : f(A') = (f(A))'. 

f(z)< (H(AUB))'=A1(2)< fH((AUB)'}—z 
5 7,<A! et z<B'<—>{(z)< f(A!) et f(z) 
<— f(2)< (f(A))' et £(2)< ((B))'A(2) 
> f(z)< (f(A) U f(B))'. 

D'où : ({(AUB))' = (f(A)U f(B))'; 

<— {(AUB) = {(A)U {(B). 


ThVAZ) On a : P(x([X1, X2[)) = P(x(X2))-P(x(X1)) = P(-0 ,XD-P(J-o, Xi) 


= P([x: , El) pour la loi qui admet f(X) pour f.r. 
sur l'axe réel des X. 


Nous noterons schématiquement la relation à démontrer : 
x(12N34) = x(12)Nx(34). 


Supposons d'abord que : 12134 Z # (segments non disjoints). 
z<x(12034)<=—P(x(12034)/z) = 1<P(12134) = 1P(12) = let 
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P(34) = I<P(x(12)) = 1 et P(x(34)) = 1=P(x(12)0x(34)) = 1 (par 
ATC1)==z< x(12)Nx(34) ; d'où, par ACIet TRTC9 : 
x(12034) = x(12)Nx(34). 
D'autre part : 12134 = #—>P(12N34) = 0 pour toute loi > 
P(x(12134)/z) = O0 pour tout z<x(12N34) = # (par ATC2), ce qui 
complète la preuve. 

ThVAS5) DVA6G—PP(A.B/z) + PP(A'.B/2) = P(B/z)=—>(par ThC2). 
B = (ANB) U (A'NB) quiimplique, comme en lapreuve de ThP1, la 
distributivité générale. 

Remarque sur Al) 


Une forme générale de l'affaiblissement du caractère "'valuation' des 
PP quand le premier terme de la séquence décrit une chaine de T est : 


AZ A'—=|PP(A,.B/z) + PP(A.B/z) - PP((AU A).B/z)| = 
= f(PP(A,.B/z), PP(A.B/z)), (1) 
Une forme générale de l'affaiblissement du caractère l'écart'' des PP 
dans les mêmes conditions est : 


Ay<A!'=e((A;U A), A) = g(PP(A4B/2)). 
qui, par la relation triangulaire implique : 
|8*(PP(A,.B/2)) + g'(PP(A.B/2) - g'(PP((A,UA).B/2))| < 
<= 2|/g’(PP(A,B/z)).g (PP(A.B/z)). (2) 
Or (1) et (2) sont des conditions de même forme et la limitation im- 


posée au choix des PP sera minimum sielles sont équivalentes. L'axiome 
AI assure cette équivalence. 


Vérification de l'axiome, AIl sur (m.l.f). 


On sait qu'on pose : P(A/z) =|| E(A).Y (z)||*, où :Y (z) est un vecteur 
unitaire appartenant à la m.l.f de dimension un, z. 


Et ensuite : P(B/A,z) = || E(B).E(A).Y (2)|P/1|EG) Y (2)? 

d'où : PP(A.B/z) = || E(B).E(A)Y(2)||°. 

Par suite, pour deux atomes, x et y: 

PP(A.x/ y) = || E(x). E(A).Y (y) |? = (E(x).E(A) (y), E(A) 4 (y)) 
mais : E(x).E(A) Y(y) = kWY(x); 

d'où : k = (E(x).E(A).W(y),W(x)) = (E(A) Y(y),Y (x)). 

D'ou 

PP(A.x/y) = (E(A) (y) (x). (x), E(A) (y) =] (E(A) (y) V(x))f? 


Or le produit scalaire (E(A),Y(y),W(x)) satisfait à DV 1 et à AV1 : donc 
All est vérifié ; AIZ2 et A13 sont ensuite immédiatement vérifiés. 


Indépendance de ATCI et des axiomes qui le précèdent : 


si: Sur le treillis ci-contre, Supportant une P dont les valeurs sont données 
à côté de chaque élément, les axiomes précédant ATCIsont vérifiés, mais 


ASCII ne Llest pas. 
u(1) 
D DR ET 


a(1) a'(0) b'(0) b(1) 


ER EU des rhes 
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ENT 


BELATIONS ENTRE LE PRESENT MEMOIRE ET CERTAINS TRAVAUX 
AMTEBRIEURS : 


; Lz relztion entre les pseudo-probzhilités de séquences et les écarts 
sur les chzines de T peut s'écrire, quand AKA, : 


e(41,44) =Ÿ PP((A,-A,).B/ 2) = | £(8).€(42-A,).% (2) | 


Supposons que À,et À, s0ient deux éléments de la chaine spectrale 
d'une y ,2 particulière :12 variable dynsmique q (coordonnée généralisée) : 


ÂÀs= a{]-,04) 4 go), et, Az g(]-œ, QD = g(Q); avec Q,< Q,. 


Des propriétés de l'application q découle immédiatement que e(A,,A;) 
est aus, un écart sur l'axe réel des Q : 


e{A;,A:) = e(Q,, ©). 


Supposons que B soit une m,1,f, spectrale de 12 y ,2, particulièrep, 
-moment conjugué de q ; on #añt que q et p ne commutent pas, 


séhnies fhutins À à dé sb dé dd SU à: 


J'appelle “séquence immédiate" de propositions expérimentales 14 
suite oréonnée : (4,-A4) puis (B2-B1), ou : ‘un corpuscule était sur[(Q,,0,[ 
dont l'impulsion est sur |P,PA"., L'expression séquence immédiate est 
destinée à rappeler que l'on suppose qu'il n'y 2 pas évolution temporelle 
de l'étzt9 (2), 


Lzissant Pet P, fixés, contidérons l'ensemble des séquences immé- 
| Aiates intenses en f2isamt varier Q,et Q,, c'est-2-dire, l'ensemble des 
-2ttributions À posteriorid'une position un corpuscule d'impulsion connue, 


VESTES ALTO ORTORENATETRTE 


Écn£, un écart sur l'axe des Q : e(Q),,0,), En ce sens 51 donne un contenu 
meifectisement topologique aux propositions de localisation 2 posteriori, 
- L'opinion, courante parmi les physiciens de l'école de Copenhague, que de 
telles propositions sont vides de sens, n'est pas fondée, 


1 
L- Le formalisme fait corresponûre 3 cet ensemble, pour un étatW (2) 


Dans une conférence que nous zvons faite en 1953 au séminzire de M, 

“ie Professeur D2rmois nous Avions construit le formalisme quantique dans 
Le cas particulier de deux yari2bles dynamiques conjoguées en réglant 
axiormatiquement cette loczlisztion à posteriori; le mémoire actuel englobe 


| leur c2s dans une théorie générzile, 


REMARQUES 


BEMALPBQUE sur l'identification des relstions :2t— bet2< b : 


En calcul des propositions : (2+—b)—(+—-2—b); c'est un cas particulier 
és fh£oreme de éééuction (13, $ 21); 


et: (2 —6b)e2(-- 20 b)<SP(2' UV b) = 1, pour toute loi de probabilité 
23 deux valeurs : 0 et 1 (13, $ 28, #29); or sur un treillis 2yant un élément 

Puniversel, u, seul cet élément satisfait 2 12 condition: P{u) = 1, pour toute 
“ci; donc : 


- 
: 
- 
2 
1 
e 
= 
= 
d 
E 


E- P(2'U b)= 1220 b-u, 
| Sur tout treillis 2 (2 b)= (2! U b = u), 12 réciproque n'étant vraie 
que si ce treillis est booléen, 
Sur un treillis booléen on 2 donc : 
(2+—b)=( —2— Dh) (2«b), 
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et l'identification de a+—b et ab constitue un affaiblissement de a-—b. 


Mais, sur un treillis non distributif, at—b et ab sont, toutes 
deux, plus fortes que a > b ; en ce sens, leur identification est plus 
l'acceptable'' sur un treillis non distributif tel que (m.l.f.) que sur un 
treillis de Boole, 


REMARQUE 


- Relations entre les postulats qui règlent un calcul des probabilités sur 
un treiliis et la modularité ou la distributivité de ce treillis : 
Nous voulons, en particulier, préciser les liens entre la "relation 
modulaire'! : 


P(x) + P(y)= P(x y) +P(xN y) ; (RM) 
d'une part, et la modularité : A& C—> À U (BANC) = (AU B)N C, (M), 
ou la distributivité : AU (BN C) = (AU B)N (AU C), (D) d'autre part. 
Dans le mémoire de von-Neumann et Birkhoff, on postule (RM), non 


pour une probabilité, mais pour une ‘fonction de dimension, d(x), qui 
est, de plus, supposée strictement croissante : 


Rey dt) dy). 
Or : AU(BNC)< (AU B)NC (terme à terme) ; mais : 
(RM)= d(AU (BnN-C)}=a ((AU B)n°c}, 
qui exclut l'inégalité stricte ; d'où (M). 


Une fonction de probabilité n'est pas strictement croissante, mais 
supposons qu'elle satisfasse à ATC2 (tout élément de T, autre que #, 
appartient à un treillis de certitudes) ; Si on lui impose (RM) on en déduit 
AVAI, puis : 
p[(AU B)NC)-(AU (BN C))] = 0, d'où (M). 


Donc : (ATC2 et RM)—= (M). 


Supposons maintenant que l'on impose au calcul des probabilités, en 
plus de ATC2 et de RM, le postulat AC1 (tout élément de T est une union 
d'atomes). Alors, par RM: 


xNy=8—> P(x) + P(y) = P(xU y) ; puis, par AVAI (impliqué par RM) : 
P(x) = P(xU y - y); puis, par ACI et ThTC9 : x = x U y - y ce qui impli- 
que : x y' ; en résumé : x y = Ü— x<y!' ; il y a donc équivalence de 
l'axiome quantique et de l'axiome classique des probabilités totales ; d'où, 
par ThPi, la distributivité (D) : (AT C2 et RM et AC1)— (D). 


Donc, sur (m.1.f.), dans un espace de Hilbert de dimension finie, si 
l'on suppose ATC2 et ACI, il faut abandonner RM, puisque un tel treillis 
n'est pas distributif ; et, sur (m.1.f), dans un espace de Hilbert de dimen- 
sion infinie, si l'on suppose simplement ATC2, il faut abandonner RM 
puisqu'un tel treillis n'est même pas modulaire, , 
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SUR LES AGREGATS DE DISTRIBUTIONS 
STATISTIQUES D’UNE MÊME FAMILLE 


par 


P. THIONET 


PRÉAMBULE 


1 - La notion de distribution statistique est bien connue. Par exemple la 
distribution des revenus (des habitants d'un pays donné) s'obtient en comp- 
tant combien d'habitants ont des revenus supérieurs à 5 millions, compris 
entre 4 et 5 millions, entre 3 et 4 millions, etc ... ‘'Distribution des 
habitants suivant leurs revenus'' serait plus correct. 


Distribution et répartition sont synonymes. 


On peut envisager encore la distribution des exploitations agricoles 
suivant leur superficie, la distribution des établissements industriels et 
commerciaux suivant leur chiffre d'affaires, la distribution des mêmes 
établissements suivant le nombre de leurs salariés, etc ... 


2 - On définit par ailleurs des lois théoriques de distribution : 


Loi de Gauss (pour une variable pouvant être négative), 
Loi de Galton, 

Loi de Pareto, 

SEC SE 


Les distributions statistiques courantes ont souvent une ressemblance 
marquée avec telle ou telle loi théorique de distribution : par exemple 
certaines distributionsde revenus imposables sontassez exactement super- 
posables à une loi de Pareto (''ajustée!! convenablement). 


3 - Quand on réunit 2 populations dont les distributions (de revenus, pour 
fixer les idées) suivent chacuneune certaine loithéorique, ilest bien connu 
que la distribution résultante n'a pas en général la même allure que les 
distributions composantes. Par exemple si les composantes sont unimo- 
dales ( et de modes différents) la résultante présente très souvent 2 modes, 
dont chacun est voisin du mode des composantes. 


En langage plus familier, la réunion de 2 distributions à une bosse 
donne le plus fréquemment une distribution à 2 bosses. 
4 - Nous conviendrons d'employer ici les termes suivants : 
 - les distributions composantes seront des distributions de base; 
- en réunissant deux populations de base, on obtient un agrégat. 


Ainsi par exemple si l'on mélange 2 distributions de Galton, l'agrégat 
n'est plus une distribution de Galton quand les modes des distributions de 
base sont distincts. Lorsque les modes sont confondus, on peut encore a- 
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avoir des doutes: et le calcul montre bien que l'agrégat n'est pas une dis- 
tribution de Galton (même s'il existe une certaine ressemblance graphique 
entre les deux). 


Le calcul montre de même que des distributions de base de Pareto ne 
donnent pas d'agrégat qui suive une loi de Pareto. 


5 - On s'est donc posé la question suivante : Existe-t-il des types de dis- 
tribution assez généraux (ouassez particuliers)pourqu'ils puissentrepré- 


senter à la fois : 
- certaines populations de base, 


- les agrégats de celles-ci? 


Ctest un problème de mathématiques pures. 


6 - Pourtant les origines de ce problème sont d'ordre statistique. Par 
exemple, M. Fonsagrive, notre collègue à l'I.N.S.E.E., s'est posé cette 
question, à propos d'une étude de M. Marchand, publiée au Bulletin de la 
Statistique Générale de la France de Janvier-Mars 1945 et intitulée : 
La concentration du personnel dans les entreprises en France entre les 
deux guerres, On expose dans cette étude les résultats d'un ajustement de 
lois de Galton sur les distributions des entreprises suivant leurnombre de 
salariés (à l'intérieur des grandes branchesd'activités collectives). Beau- 
coup plus tard M. Fonsagrive a attiré notre attention sur ce problème 
Des problèmes d'agrégation se posent constamment enéconométrie (théorie 
des choix, courbes d'Engel, élasticité de la demande, etc.) et ont-fait 
l'objet de travaux récents de MM. Nataf, Malinvaud, en France. 


7 - Nous avons eu l'idée d'appliquer au problème de l'agrégation des dis- 
tributions statistiques la méthode de la courbe de concentration de C. Gini 
dont nous avions déjà fait usage pour résoudre en 1954 un problème de 
sondage, à nous posé par la Direction Générale des Impôts (1). 


Une première étape des recherches, très brève et presque d'ordre 
expérimental, n'a porté que sur quelques courbes de concentration parti- 
culières, rencontrées au cours du travail sur les sondages. L'énoncé du 
problème et les résultats fragmentaires alors trouvés(3 exemples traités) 
(qui formaient une première note de mai 1955) constitueront la lère partie 
du présent exposé, avec quelques rappels derésultats concernant la Courbe 
de Concentration de C. Gini et Lorenz,. 


8 - En décembre 1955, M. Fréchet, nous fit savoir (comme suite à notre 
note) qu'il avait établi un théorème, d'après lequel n'importe quelle courbe 
de concentration possède la propriété que nous avions constatée sur le 
premier de nos 3 exemples. 


Par la suite, nous avonsdonné du théorèmedeM.Fréchet une démons- 
tration un peu nouvelle puis (encouragé par M. Fréchet à poursuivre ces 
st) nous avons étendu cette démonstration à des cas beaucoup 
plus généraux, correspondant à nos Exemples 2 et 3, car le théorème 
initial concernait seulement une famille de distributions ne différant entre 
elles que par les deux paramètres :effectif de la population et valeur moy- 
enne de la variable, 


Nous sommes arrivé à’l'énoncé suivant : 
(Etant donné une famille quelconque de distributions, d'une variable 
(x(-o<a<x<b), à un nombre quelconque de paramètres: pour que l'agrégat 
(de telles distributions de base fasse lui-même partie de la famille, il faut 
(que les moyennes arithmétiques des distributions de base soient égales 
(entre elles. 


(1) Voir Journ. Sté Stat. Paris. Juillet-Sept, 1955, page 192, 
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La condition n'est pas suffisante; mais nous donnerons la forme géné- 
rale des familles de distributions possédantcette propriété(elles dépendent 
de n fonctions arbitraires et n-1 paramètres, outre la moyenne commune 
des distributions). 


9 - Ainsi il n'existe pas , par exemple, de loiunimodale telle qu'une famille 
de distributions ayant même mode (et des moyennes différentes) puisse 
comprendre en son sein ses propres agrégats. 


10 - Les démonstrations du théorème de M. Fréchet et de son extension 
font l'objet de la seconde partie du présent exposé. 


Nous tenons à exprimer ici notre gratitude à M. Fréchet et à M. 
Malinvaud pour le concours décisif qu'ilsnous ont apporté dans cette étude, 


PREMIÈRE PARTIE 


POINT DE DÉPART ET PREMIÈRES RECHERCHES 


I. - DÉFINITION DES LOIS DE DISTRIBUTION PAR LEUR COURBE 
DE CONCENTRATION 


1 - LA COURBE DE CONCENTRATION DE LORENZ GINI 

Rappelons la définition de 1a courbe de concentration (qu'on rencontre 
chez les auteurs italiens, plus que chez les auteurs anglo-saxons ou fran- 
çais) 

Considérons la distribution d'une variable positive x (par exemple le 
chiffre d'affaires d'un établissement industriel et commercial) ; on intro- 
duit 2 variables p et q comprises entre 0 et 1; à savoir : 


p, proportion des redevables dont le C.A. est inférieur à x ; 
q, proportion du total desC .A. correspondant aux redevables dont leC .A. 
est inférieur à x, 
Par définition, le lieu du point de coordonnées cartésiennes (p,q) est 
la courbe de concentration; soit : 


g (p,q) = 0 Fig. 1 
La 01 11 
l'équation de cette courbe (1). On a évidemment : 
g(00) = g(11) = 0 
. dq q 
ainsi qu'une condition de croissance de 6 
c'est-à-dire g', g; 0 à : 5 


haie 
et une condition de convexité pe > 0 


Remarque : La notion de courbe de concentration s'étend à une variable 
Re Lire » L P< … 
pouvant présenter des valeurs négatives, par exemple les bénéfices des 
” de ES LA 
entreprises (industrielles et commerciales), le total des bénéfices restant 


positif. 
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(Voir Fig. 2 la forme de la courbe de concentration). 
En pareil cas la condition de croissance ci-dessus disparait; celle de 
convexité subsiste. 


Nous ne ferons guère usage de cette extension; mais nous admettrons 
une fois pour toutes que lavariablex estcomprise entre a etb, avec (-x<a) 


2 - LOI DE PROBABILITE ET COURBE DE CONCENTRATION 


On passe de la loi de probabilité à la courbe de concentration par les 
formules suivantes : 


Soit : f(x) : la densité de probabilité (dont on suppose l'existence); 


:m : l'effectif total de la population (d'ailleurs infini); 
: mX : (x) le C.A. total de la dite population. His 
11 
On voit facilement que : ” 
mif(x) = HE 
dx 1 l 
d'où f(x) =—: 
tu os 
P dp? 
a \* 00 
3 EXEMPLE LOI DE PARETO.:p= 1 -(£) 10 


où a désigne leC.A.minimum et où],6< œ<1,9.1I1 vient d'une part: 


m/(x) = m ef" 


x 


d'autre part : 


œ 
dq = + = (x) dx Le _ dx 
>.< m X X 
œ ot-1 
d'où CG a _ L 1e | (avec a > 1) 
+00 a 
Mais x #} = 
i nul SUN ra à 
= 
d'où = | ja 
x 
—1 
D'où g(p,q)= (1- pa (1 +q)=0 


4 - DISTRIBUTIONS DEFINIES PAR L'EQUATION DE LEUR COURBE DE 
CONCENTRATION g(p,q) = 0 


a - Si l'on résoud en q l'équation de la courbe de concentration, x et f(x) 
s'en déduisent (par 2 dérivations), en fonction du paramètre arbitraire & 
Ainsi la courbe de concentration définit une certaine famille de daté 
tions statistiques ''semblables entre elles'';:la valeur moyenne de la varia- 
ble caractérise chacune des courbes de cette famille, 


Il est remarquable que les courbes de concentration les plus simples 
et les plus naturelles ne correspondent pas à des distributions d'usage 
courant. En voici quelques exemples, 
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b - Nous nous sommes attardé sur lecasoù cettecourbe serait assimilable 
à un arc de conique, c'est-à-dire : 


g(p,a)=ap(i-p)+tbq(1-a +cep(l1-aq)+d4q(1-p) 
à (Es +c)p +(b+d)q-{[a p?+(c + à) pa + ba!] 


Et nous avons trouvé que cet arcprésentait laforme voulue, à condition 
d'avoir simultanément : 


(a + c) (b + d) <0 
(b +c)(a +b+c+d)<0 
(br+ da bieccd) (ab #+e+d)=>0 


c - La courbe ainsi définie s'estrévélée trop lourde pour la pratique.Nous 
sommes passé de 3 à 1 paramètre, en faisant usage de l'hyperbole équi- 
latère d'équation : 


pqa+tep-(l+te)q=0 (E> 0) 


qui présente d'ailleurs le grave défaut d'être symétrique par rapport à la 
droite d'équation 


Data} il 


ce qui n'est pas le cas de beaucoup de courbes de concentration réelles. 
On obtient : 


Il. - LE PROBLÈME DE L’AGRÉGATION DES LOIS DE DISTRIBUTION 


1 - AGREGATION DE PLUSIEURS DISTRIBUTIONS 


a) Considérons par exemple la distribution desC.A. des épiciers, agrégat 
des deux distributions relatives aux épiciers détaillants et aux épiciers en 
gros. Soit 


(1) HIb, di OR, lb, qd) = 0, 


les équations des 2 courbes de concentration correspondantes, On admet 
que les C.A,. des deux distributions sont exprimés dans la même monnaie; 
la variable x est donc commune aux 2 distributions et à leur agrégat; et il 


vient : 


Fig, 4 
- dq Ps dd, 
“4 * dp M P: 
ou encore 
DEC" Te 
(2): m op __m, ùp 
_l dg dg 


1 
(x) og (x) 0q 
Cette relation entre les pentes des 2 courbes de concentration définit 
une correspondance entre points homologues M et M, correspondant à une 
même valeur de la variable x. 
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b - Soit P, Q les coordonnées d'un point de la courbe de concentration de 
l'agrégat. On a les relations suivantes : 
entre les effectifs RTE MA VI :mp+mp,=MP &) 
5 
entre les C.A. totaux : (x) + (x4) = (X) (3) : (x) q + (x1) q1 = (X) Q 
L'équation de la courbe de concentration de l'agrégat s'obtiendra en 
éliminant les 4 quantités p q p, q, entre les 5 relations (1) (2) et (4). 


c - On étend immédiatement cet énoncé au cas d'un agrégat de plus de 2 
distributions. 


2 - SUR LES FAMILLES DE DISTRIBUTIONS SUSCEPTIBLESD'AGREGA- 
TION. 
Divers auteurs ont proposé des expressions (dépendant de certains 


paramètres) susceptibles de représenter (plus ou moins heureusement) la 
distribution des revenus ou des salaires, des effectifs, des chiffres d'af- 


faires, etc ... d'un pays donné(lois de Pareto, de Galton, etc .. .). Ils ne 
semblent pas s'être posé la question suivante : la distribution statistique 
(de revenus, de salaires, etc ...) ainsi considérée résulte de la juxtapo- 


sition de distributions analogues concernant des sous-populations. Par 
exemple : 


La distribution des établissements industriels etcommerciauxfrançais 
suivant leur chiffre d'affaires résulte de la juxtaposition des distributions 
des chiffres d'affaires des boucheries, des épiceries, des fonderies, des 
banques, etc... 


On se trouve donc devant le problème suivant : existe-t-il des lois de 
distribution assez générales pour représenter la distribution des chiffres 
d'affaires d'un secteur économique ? 


- étant entendu qu'en agrégeant les distributions de plusieurs secteurs 
économiques, comme on le fait en pratique statistique, on devrait retrou- 
ver une loi de distribution du même type. 


Par exemple : la loi de distribution des chiffres d'affaires (C.A.) des épi- 
ciers devrait s'obtenir en agrégeant celles des épiciers en 
gros et des épiciers détaillants. 

La loi de distributiondes C.A,.des commerces de l'alimen- 
tation devrait s'obtenir en agrégeantcellesdes épiciers,des 
bouchers, des boulangers, etc .., 


il est bien clair que le type de distribution cherché ne peut être qu'ex- 
trêment général, 


La question est de savoir s'il n'existe pas de famille de distributions 
telle qu'en ''agrégeant'' deux d'entre elles (de la façon décrite au n° 1) on 
retrouve une distribution de la même famille, 


La famille formée de toutes les distributions de variable positive 
possède bien cette propriété ; mais on aimerait être sûr qu'il n'existe pas 
des familles plus restreintes à l'intérieur de celle-ci ; c'est-à-diredes 
familles de distributions dépendant d'un nombre donné de paramètres. 


Il faudrait trouver des fonctions G (9,0) telles que l'on ait (symboli- 


quement) 
1 Tag og 


(5) RO Duuni M A0 EP 


RP RS rs 
(x)0q (x) dq, (xX)0Q 
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3 - ETUDE EXPERIMENTAILE - 


Renonçant à aborder directement un problème aussi difficile, on peut 
chercher des fonctions G de forme déterminée, en supposant qu'il existe 
des relations remarquables entre (x), (x;), m, m1. 


Exemple 1 : G = P2+Q2-2Q=0 :a-t-on la relation (5)? 
(5) s'écrit : 
Ps mp + m;, P: 


a art ODastu) a - = D 
(x) (x4) (x)? + (x)? 


On a en réalité l'identité ci-dessous : 


m m;, m m; 


EP CL d,- 1 
(x) (x) (x) m; 


On ne parvient donc au résultat voulu que si 


Vos Pres TES (et analogue pour VB) 


autrement dit: x=Xx;, (agrégation de groupes de même C.A. moyen). 


Cette dernière relation est nécessaire et suffisante pour que l'agré- 
gation conserve la forme de la loi de distribution. 


Exemple 2:G=(atc) #+(b+4)Q cf P?+(c+4)#Q +bo! ] = 0 
Il vient pour (2!) 


à @+c)-2ap-(c+d)q_. (arte) -2 ap: -(ce;+d,) 
(b +4) - (c + d) p - 2 bq (b;+d;) - (cs + di) p: - 2b1 q, 


En général, il est bien clair qu'on ne peut déduire (5) de (2'). 
Et a priori on n'a pas pensé qu'il suffisait, pour y parvenir, de faire : 
X=%X;, 
Exemple 3 :G =#O+e@-(1+e)Q=0 


La relation (2!) s'écrit : 


a TRE VS rotin Chi venes Eenld 
p-{1+te) Pelle) 


et, pour X = X,, on peut en déduire la relation (5) ; l'agrégation semblerait 
donc possible, le paramètre de la distribution de l'agrégat étant 


PL ES a 2 + (x3) € 
m +m:, (x) + (x) 


Ainsi X = X, serait une condition suffisante pour que l'agrégation con- 
serve la loi de distribution. Il n'est pas évident que cette condition soit 
nécessaire; on établira pourtant dans la2e Partie qu'elle est nécessaire et 


non suffisante. 


DEUXIÈME PARTIE 


THÉORIE DE L’AGRÉGATION DES LOIS DE DISTRIBUTION 


I. - PRÉLIMINAIRES 


1°) - DISTRIBUTION, LOI DE DISTRIBUTION, COURBE DE CONCENTRA- 
TION. 


Il sera utile pour la suite de noter les faits suivants : 
Il revient au même de se donner : 


- une distribution particulière, 

- la loi de distribution correspondante, plus l'effectif de la distribution, 

- la courbe de concentration correspondante, plus la moyenne de la loi de 
distribution, plus l'effectif de la distribution. 


Il revient au même de se donner : 


(a) une loi de distribution particulière, 
(b) la courbe de concentration correspondante, plus la moyenne de la loi 
de distribution. 


Remarquons que ce dernier énoncé découle directement des formules 
déjà trouvées : 
Soit x et y les coordonnées de la courbe représentant la loi dedistribution, 
p et q les coordonnées de la courbe de concentration, 


Ke ont 
Passage P 
LAUERS y=- RSS -f(x) 
P 
: dp =f(x) dx 
assage 
de (a) à (b) dq = 2F(x) dx 


Conséquence : l'agrégation concerne des distributions elles-mêmes (a'ef- 
fectif m,m/,; de moyenne x, x). 


Une distribution-agrégat correspond de façon univoque : 
à une certaine loi de distribution, 


s 


à une certaine courbe de concentration. 
Réciproquement : 


une courbe de concentration donnée; 
plus une moyenne donnée : X = (m x + my X3)/ (m + m), 


plus un effectif donné Mn Een 
déterminent une distribution (agrégat ou non), 

2°) - NOTATIONS ET SYMBOLES : 
a) On désignera par m, m, les effectifs 


"Le des distributions ; 
X , x, les moyennes 
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par d une distribution, 
une loi de distribution, 
€ une courbe de distribution, 
& une courbe de concentration (de Gini), 


par &« fi ....0 des paramètres. 
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Aux lettres minuscules concernant les distributions de base corres- 


pondent des majuscules concernant les agrégats. 


b) L'agrégat de 2 distributions de même moyenne sera symbolisé par 


D (&, m +m,) = d(xX, m) + d (X, m.) 


Mais on peut désigner la distribution d'effectif m, de moyenne x et 


admettant g comme courbe de concentration, par 


(g, 5) 2 
Posons alors : 


avec M =m +m;, 


autrement dit : 


(g:X)n 12 (8,X)m, = (G, An 


c) Le théorème de M. Fréchet (qu'on va établir plus loin) s'énonce comme 


suit : 
1) Condition suffisante : quel que soit g, on a 
(es re Ê (g; ce 
2) Condition nécessaire : il n'existe aucun g tel que 
(g, ERP 5 (g;, *} + (g, #1 )m4 
du moment que X et x, sont distincts. 
d) La distribution particulière ... (g, X)m 


appartient à la loi de distribution ... (g, x) = { (g, x) 


qui appartient elle-même à la famille de lois de distributions admettant 


la courbe g comme courbe de concentration, qu'on peut noter : 


(g,0) 


e) Le problème qu'on va étudier (après celui de M. Fréchet) concerne une 
famille de courbes de concentration g (æ, fi) ou Bag °U 8 - + n para- 


mètres]. 
On va rechercher à quellesconditions peut être réalisée une égalité de 
la forme : 
(a » EUR = (Sœp X)" (8, P; , LA 
avec M = m +m; 


MEN EEE 


 . eo EE 0 07 


On peut toujours poser 


(8 « B » Li nn + (g Gi, (ELME Fm (Gr +) 


G étant une courbe de concentration déterminée par les deux distri- 


butions de base, c'est-à-dire 
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- dépendant de la fonction g choisie, 
- dépendant des valeurs a f3 ... et aussi œ&1 (31 ..., 
- dépendant de x, x,, m, m:;, 
ou plus précisément de — et de ; 
1 
ou (ce qui revient au même) de x Ft de M. 
Le problèmeenvue est finalementdesavoir si l'onpeut trouver À B... 
tels que 
G = 8a8 
3°) METHODE DE CALCUL 


a) Outre les notations de la lère Partie, on va poser : 


nr -Gu) _ mu. %1 , 
À=— i) LE x mx u (1) 
donc 
DOVE _d+Ha,. 
Dee Mie 
On utilisera également : 
FH UNN A UE Le ha 
SE re NE TT 


b) Cas où l'on considère une distribution donnée : 


L'idée (essentielle) prise à M. Fréchet est de choisir comme para- 
mètre la pente de la tangenteau point courant de lacourbe de concentration 
(2); “soit: 


+ --4q 
dp 


Les équations paramétriques de cette courbe sont donc 


p =æt) 
a = /Ctdp= Lt gt) 


On remarquera (comme conséquence de la convexité de la courbe de 
concentration) que la fonction p{t) doit croitre de 0 à 1 lorsque t croit de 
a à b. 


Rappelons que la limite inférieure (a) de t peut être négative mais 
existe (n'est pas -) ;sa limite supérieure (b) peut ne pas exister (b : +) 


æ(t) est encore soumis à une condition essentielle, à propos de Glke 
Alors que, pour t=a, on a forcément q = 0, il faut s'assurer que, pour 
t = b, on a bien q = 1, En intégrant on parties, il vient : 


= [te] - [et 
Dos er dt 
avec a œ(a) = 0, p(b) = 1. 


(1) Les effectifs metmi sont en fait infiniment grands,mais et u sont des nombres finis 


(2 ) Cette courbe est donc supposée avoir des tangentes et (plus généralement) ne présenter 
aucune anomalie, 
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D'où la condition : fs 1 


b w(t) ! 
Jeter a =» - à, 
n 1 


0 a t 
ce qui revient à dire que l'airehachurée doit être égale à 1 (figure 5). Re- 
marquons enfin qu'il revient au même de se donner la courbe de concen- 


tration g ou au contraire la fonction (t) satisfaisant aux conditions pré- 
cédentes, 


œb-—————— 


Plus généralement, on peut remplacer la lettre g par la lettre@ dans 
le paragraphe 2 ci-dessus, pourvu que la fonction @{t) soit soumise aux 
conditions énoncées, qu'on appellera conditions normales (ou N) et qu'on 
résumera comme suit : 


croissance de p{t) dt=aàt=b; 
Conditions N 


pour œ(t) limites (a) = 0, æ(b)= 1 ; 


L g(t)dt=b- 1. 
c) Cas où l'on considère 2 distributions de base et leur agrégat : 


On réservera alors les lettres (pqt p) à la première distribution de 
base ; (p, q,; t;: ®:) correspondront à la seconde et (P Q T ®) à l'agrégat. 


Le théorème de M. Fréchet correspond au cas où œ %, ® sont identi- 
ques. 


La relation x = x entraine, lorsqu'on agrège les distributions : 
74 = X4 dg, = x 19 
dp dp, dP 
Mais on pose 
ei 
dp £ 
ee da. X4dq , 
dp, %X, dp 
ou 
CP + = kit 
De même 
dQ _x dg , 
PART dp 
ou 
ÉTAT 
T = ñ Fu CRE 


d) Cas particulier 


Si les 2 distributions de base ont même courbe de concentration, il 
vient : 


p, =p{kt) 
qd, = [xt œ(kt) k dt 
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Et si l'agrégat lui aussi a même courbe de concentration que les dis- 
tributions de base, on a : 


P =œl(ht) 
Q = fht (ht) h dt 


Il suffit de rapprocher les deux expressions de P, pour avoir la rela- 
tion : 


À 
ro AURAS (D) 


h (1-k) (ht) - k (1-h) (kt) = (h-k) p(t) (E) 


qui peut s'écrire : 


Cette équation fonctionnelle (E) va’ jouer un rôle essentiel dans toute la 
théorie, 


e) Cas général. 


Lorsque les courbes de concentration sont distinctes, leurs équations 
paramétriques sont analogues, mais avec % w,et ® au lieu de {t), p(kt), 


p(ht). 
De 


À 


® (ht) E g(t) tA €: (kt) (D!) 
ce qui peut s'écrire : 


h (1-k) ® (ht) = k(1-h) @,(kt) + (h-k) œ (t) (E!) 


Cette relation définit la fonction ® à l'aide des fonctions @ et @,, et 
des paramètres keth. 


on tire donc : 


En particulier si @{t) = @ (a, B;t) 
p(kt)= (ou Pikt) 


la fonction ® dépend de la fonction @ et des paramètres (opra fier. (RATE 
Et notre problème conduit à l'équation fonctionnelle (E''). 


h(1-k) @ (A,Bht) - k(1-h) @ (œ B; ; kt) = (h-k) p (af; t)| (E") 
qui fait pendant à la formule D' 


PET)EEA ; 
p(A,B;ht)= (x ) Ex CA : kt (D'') 


f) Conditions supplémentaires ou conditions S : 


On désignera par ‘conditions S"' imposées à œ@(t), les conditions : 
a = 0, b = +, autrement dit (fig.6 ) Fig. 6 


æ (0) = 0 æ(+æ) = 1 
Ces conditions jouent un rôle essentiel, ? 


D'ores et déjà, on voit que, puisque n 1 2 
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les "'conditions S'' signifient que lavariable x a comme intervalle de varia- 
tion (0, +), 


11. - CAS DE DISTRIBUTIONS ADMETTANT LA MÊME COURBE 
DE CONCENTRATION 
1°) - RESUME DES CALCULS QUI SUIVENT 
Le problème qui se pose est larésolution de l'équationfonctionnelleE; 
h(1-k) (ht) - k(1-h) @ (kt) = (h-k) œ(t) (E) 
où p(t) doit déjà remplir les conditions N, 


On va d'abord supposer h etk différents de 1 ; et on va montrer qu'au- 
cune fonction p(t) n'existe; on sera ramené alors au cas où 


= 1 


ce qui entraine k = h;et alors (E)est manifestement satisfaite quelque soit 
g(t). De même que (D). 


Tel est le théorème de M. Fréchet. 
Supposons donck# hé 1. 


2°) - LES CONDITIONS S SONT EN REALITE DES CONDITIONS NECES- 
SAIRES - 


On voit facilement qu'aucune fonction @ n'existe si t n'est pas une 
variable prenant toutes les valeurs de 0 à +. 


En effet, si 0< a t<b, ceci veut dire que x varie entre 
ax et bx pour la lère distribution 
ax, et bx, pour la 2e distribution 
aX et bX pour leur agrégat. 

Supposons x,<Cx (donc k>1leth> 1) 

donc ax,< aX < ax et bX,< bX< bx. 


Il existerait ainsi des unités de la 2e population pour lesquelles x 
prendrait une valeur comprise entre ax, et aX ; alors que, dans l'agrégat 
des deux populations, il n'existerait plus de telles unités. Ceci oblige à 
prendre a = 0, 


De même les unités de la lère population, pour lesquelles x serait 
compris entre EX et bX, disparaitraient quand on envisage l'agrégat des 
deux populations. Ceci ne peut s'expliquer que si b est infini. 


Ainsi @(t) devra remplir à la fois les conditions NetsS, 
3°) - RESOLUTION DE (E) 

a) Première méthode. 

On remarque que œp(t) = 
et œ(t) = 


sont 2 solutions particulières de l'équation(E);mais celle-ci est''linéaire!! 
de sorte que 
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lt) = polt) = À + 


(où À et H sont 2 paramètres arbitraires) est aussi une solution de (E); 
mais (E) est une équation aux différences finies du 2e ordre, la variable 
étant Lt. Ainsi p,(t) est l'intégrale générale de (E). 


b) Seconde méthode. 


En supposant que les fonctions p(t) sont dérivables, on peut résoudre 
directement l'équation (E), ce qui nous servira par la suite. 


Dérivons les 2 membres de (E) par rapport à h, puis par rapport à k. 
Il vient : 


(1-k)@ (ht) +h (1-k) t@'(ht) +kp(kt) = p(t) 

- @(ht) - ht æ'(ht) + @ (kt) + kt p'(kt) = 0 
C'est-à-dire : 

g(ht) + ht œ'(ht) = p(kt) + kt p'(kt). 
Et, comme (k£# h) par hypothèse, il vient 
@(ht) +ht p'(ht) = constante 
équation de la forme 
(u) +u p'(u) = À 


dont l'intégrale générale est 
es fe 
œ(u) = À + = 


4°) - CONCLUSION 
Avec k£ 1, il n'existe d'autres fonctions dérivables œ(t), solutions de 


(E), que celles de la forme 


dupe IH] 
RS er 


croissantes pour U<T0, mais qu'on vérifie être incompatibles avec les 
conditions (S); car @ tend vers -o quand t tend vers 0, 


On est donc ramené au cas où k=1 =h, c'est-à-dire x = x, = X ; alors 
tout @ convient. 


Ainsi la condition nécessaire et suffisante pour avoir 
(EX) rm. = (8:X)m 2 (83% )m 
est que K=% (= x) 


Ce théorème de M. Fréchet s'étend tout de suite àun nombre quelcon- 
que de distributions de base, possédant toutes la même courbe de concen- 
tration. 


5°) - PORTEE DU RESULTAT - 


a) On aurait pu imaginer que la courbe G pouvait(pour certaines cour- 
bes g) venir coincider avec g pour quelque combinaison privilégiée de x x, 
m et m,. Ainsi il n'en est rien. 


b) On aurait pu penser qu'il existait peut-être des courbes de concen- 
tration g,telles que les courbes de distributionCg des lois de distributions 
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(g,0) 


formaient un faisceau, c'est-à-dire secoupaient enun nombre fin depoints 
fixes. Car il est clair que la courbe de distribution de 


(G, X) 
passe par les points de rencontre des courbes de distribution de 
(g,x) et (g »X1) 
et (lorsque m et m, varient) forme un véritable faisceau, 


Autrement dit, l'équation de C4 étant de la forme 
L (et 
Fi on 


on pouvait se demander s'il n'était jamais possible d'écrire (avec une for- 
me adéquate de fonction f) 


1 x 1 eye. 42 
2) Le 56. n &,%) 
On vient donc d'établir que cela n'était jamais possible, 


Remarque : Dans la le Partie, la condition nécessaire et suffisante x = x, 
avait bien été trouvée avec la courbe particulière g, d'équation : 


RAC ASE AE AUS 


111. - CAS D’UNE FAMILLE DE COURBES DE CONCENTRATION 


1°) - FAMILLES G CONSTRUITES A PARTIR DE g ET 81: 


a) Partons de 2 courbes de concentration g et g, distinctes et fixes, 
d'ailleurs quelconques. La relation (E') 


h(1-k) ® (ht) = k(1-h) @, (kt) + (h-k) æ (t) (E!) 


définit ® , donc G. Lorsque h et k varient, on engendre ainsi toute une 
famille de courbes de concentration G à 2 paramètres (h,k). 


s 


On voit que si h——>1, (E') donne à la limite 
æ (t) = p(t) 
tandis que sih—>k, (E') donne 
® (kt) = p,(kt ) 

Dans le ler cas :G tend vers g, et dans le second G tend vers g,: de sorte 
que la famille GK renferme bien g et g,. 

b) Par exemple : laissons fixes x et X,, c'est-à-dire k, mais faisons 
varier m et m:, 


C'est-à-dire A= 22: 


ou h = 


On a une famille G, à 1 paramètre qui renferme g et g,. 
c) Lien avec le problème étudié ici : 


Malheureusement la famille Gyn ne constitue pas nécessairement une 
solution au problème posé ici, lequel est de trouver une famille gap com- 
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prenant ses propres agrégats G. On a seulement déplacé le problème; car 
il faudrait à présent se demander si l'agrégat de Gyh et Gk'h appartient 
ou non à la famille Gap 


C'est pourquoi on n'abordera pas ainsi Le question ; on supposera au 


contraire le problème résolu, c'est-à-dire qu'on admettra l'existence d'une 
famille de courbes ga, autrement dit de fonctions 


(a, B ;t) 

satisfaisant à l'équation fonctionnelle (E'!) et aux conditions annexes avec 
k£ 1, Et on essayera de trouver l'expression de , ce qui conduira à 
établir que ne peut exister. On retombera alors sur k = 1, d'oùk=het 
(E"') vérifiée quel que soit w 

Mais (à la différence du Il ci-dessus), le fait que (E'") soit vérifiée 
n'implique pas du tout que D'' le soit (MM. Fréchet et Malinvaud nous ont 
donné des exemples simples où(E'')n'entraine pas l'agrégation, c'est aussi 
le cas pour nos exemples n° 2 et 3). On en conclura que : 


a) h=k=1(c'est-à-direX =x,) estune conditionnécessaire à l'agrégation; 


b) (D'') donne la forme générale des courbes de concentration qui se 
prêtent à l'agrégation. 


2°) - CONDITIONS IMPOSEES AUX SOLUTIONS @ DE L'EQUATION FONC- 
TIONNELLE (E'!) 


h(1-k) @ (A,B ; ht) - k(1-h)@ (x, PB, ; kt) = (h-k)@ (x, B ;t) (E') 


Conditions N : sans changement. 


La fonction @ doit être croissante, de (a) = 0 à @(b) = 1. En outre on 
doit avoir 
b Pig ou? 
nf œt) dt = 1 n 
Conditions S : : 
(2 


L'intervalle de variation de x doit être le même 
pour les lois de distribution (g,%), (g,, xi)et (G,X); 
1 


d'où les conditions: 0 E 
(AIN EX) a EE REA 1 
(max x) ID b; X1 = B se p 
D'où 2 grands cas possibles : | 
E cn 
1) Ou bien x x, X sont arbitraires, mais on a = cu 0 da E 


2) Ou bien a n'est pas nul et b est fini; mais x,et X sont liés à x. 


Ainsi, à côté du ler cas, analogue à celui étudié au II, s'ouvre un 
2ème cas où se restreignent les exigences du problème, 


3°) - RESOLUTION DE (E") - PREMIERE METHODE - 


Comme pour (E), il est clair que @ = À et g = m/t sont des solutions. 
particulières de (E''), - à condition cette fois que et u soient des fonc- 
tions convenables de &, {à : 


C'est-à-dire si on a : 
h(1-k) À (A,B) = k(1-h) À (x, (84) + (h-k) À (MM Et Pr (R:) 
et aussi : 


(1-k) p (A,B) = (1-h) p (oi, 4) + (h-k) pu (a, B) ... (R:) 
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pour des expressions A,B, convenables de «, B ; & , f: , keth. Alors 
MR 4 Me ute bit: 
PER + see (si u C0) 


est la solution générale (décroissante) de (E'"'), 


ler cas. Cette solution ne convient évidemment pas dans le ler cas (où les 
conditions S sont exigées); car, quels que soient par ailleurs À et u,œ(t) 
tend vers - &« (et non pas vers 0) quand t tend vers zéro. 


Il en résulte qu'il n'existe aucune solution pour kZ 1. 
En revanche, lorsque k = 1, c'est-à-dire x = x,, on a 
h = 1 
et l'équation (E'') est identiquementvérifiée, sans entrainer pourtant (D''): 


Il n'y a aucune raison, en effet, pour qu'on ait identiquement : 


p(A,Bit) = LHRPPIPEPR (on, Bi 5t) , (avec À =-21) 


LERX 


pour un système convenable de paramètres A,B (lorsque & ff ©, fi, sont 
donnés). 


On retrouve donc le théorème de M.Fréchet, mais amputé : la condi- 
tion nécessaire pour avoir : 


(Sas ; 4 F (8ap nn (Sa f » ile 
lorsque la variable x prend toutes valeurs positives, est que 
Ar 
(résultat qui s'étend à un agrégat de n distributions). 


2° cas. En revanche la solution de (E'!) 


gt = x-® 
parait pouvoir convenir dans le 2ème cas. Il vient : 
IH ___ab 
tea st fee li) Mbäsps 
a ; IH _ a 
=D tn Re 


d'où : 


On peut considérer que a = à« est le paramètre de la courbe g. 
La relation entre les distributions associées (g,x), et (8,,X1)m, est 
xx = &1 X1 
donc a,= ka ou X1=X 


Pour avoir la relation analogue avec la limite inférieure b, il faut que 
b =raœ 
b;=ra, 


r étant une constante, indépendante de la courbe g choisie. 
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L'expression p(t) s'écrit alors 
t œ 
ptet û -9 


Assurons nous que (R;) et (R2) sont bien vérifiées : On a 


r 
él 


(constante absolue); donc (R1) est vérifiée 


À (x,f) = 


ra (Ra) fixe la valeur du paramètre de G 
r - 1 lorsque à et &4 sont donnés. 


(1-k) A = (1-h)œ; +(h-k)æ 


Mais = k=+ d'où A= ah 
x œ ———— 
Reste la condition N des aires : b 


1=b- [ qu), 


C'est-à-dire : 


ra 
u r a 
1=ra-© tapes 


d'où : 


Conclusions : Nous obtenons une distribution unique et non pas une famille 
Ga , puisque r doit rester le même (afin d'assurer une limite supérieure 


> 


commune de lavariablex à toutes les distributions)tandis que à doit varier. 


I1 est impossible d'ailleurs de faire tendre r vers l'infini, comme on 
le voit bien sur ies équations 


de la courbe de concentration p = œ(t) = 7 = ï ——. 


sd A r£ Tr 
ni a dr Led à 


ou de la courbe de fréquences | x =x1 


y= l&tL r 
d'où 

5e) 2 

Y =|Z2r) x? 


I1 s'agit d'une loi du type de Pareto, mais tronquée car l'exposant de 
x (x-?) est trop petit pour assurer la convergence de l'intégrale 


+ 00 
Î x y dx 
œ 


à Ne un cas n'aboutit donc pas plus que le ler cas (en dehors du cas 
4°) - RESOLUTION DE (E'"), - SECONDE METHODE - 
Partons encore de (E'') où par hypothèse onak7 1. 
h(1-k) p (A,B ; ht) = k(1-h) @ (os, ; kt) +(h-k) @ (œ, pt) (El 
avec As Aa sas aiBE ht) 
B=B (œ@, BORN RrE) 
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La relation (E'') est supposée vérifiée pour toute valeur det, lorsque 
(x fi &:P;, ;h k) sont donnés par ailleurs, 


Retranchons terme à terme de (E'') l'expression suivante : 
h(1-k) @ (œ,fB ; t) = k(1-h) (x, B :t) +(h-k) p (x, B ;t) 
Il vient : 
h(1-k) [ p(A,B: ht) -p(a, p : t)]=k(in) [plouf :kt) -p(x,B; t)] 
Cette identité en t n'est possible que si : 
@(A,B ;ht) -p(a,fB:it) =p(t) 8(A,B ;&,f ;h) 
pÜai,P:, kt) -p(x,f;t) = (t) 0 (æ:f3, : &,B ; h) 
avec 
h(k-1) 6 (A,B ;«,f ;h)=k(h-1)8 (a;,B.;a,pB ;Kk) 
c'est-à-dire : 


k 
F2 0 (A,Bi0, f 7h) = 0 (ce Bi; ,f;k) 


Cette expression doit donc être une constante ''absolue!' À (x, B)quelle 
que soit la distribution variable considérée (d:, ou D); ainsi on doit avoir 
k-1 
0 (æ,,B: à, P ; k) = CL TA (œ,p ) 
d'où 


pas, Pi: kt) - p (a pt) = EX (a,B)@ (t) (H) 


On est ramené à une distribution à un seul paramètre, à savoir k =—— 


X1 
(où x, varie et X reste constant); car le paramètre À lié à la courbe g(xf) 
est déterminé par la condition N des aires ; sia<t<b, ona 


Jet dt=b-1 


kb 
f'etue) Rd KDE 2 1 
k 


a 


En intégrant les 2 membres de s.. ) entre a et b, il vient : 
re TN -A[V (b) Y (a)] 


où l'on a posé wa(th= Fa. (t) 


On peut mettre enfacteur(1- 1/k); et il reste simplement l'expression 


de À 
EN (in) eng) 


expression qui ne dépend donc plus que des bornes (a,b) de l'intervalle de 
variation de t. 
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Ainsi lorsqu'on possède une solution (t) de l'équation (EH)fMon a 
[Voir note (1)]: 


lt) = pt) + GE) -VG 


Dérivons par rapport à k ; il vient : 


= CrAU((e 
t '(kt) Lun < 


d'où l'équation fonctionnelle en 
p(kt)- œ(t) = k(k-1) t p'(kt) 
Dérivons une seconde fois par rapport à k ; il vient : 
t o'(kt) =(2k-1) t g'(kt) + k(k-1) t? @ "'(kt) 

d'où, si(k-1) { 0, et en simplifiant : 

2 p'(kt) +kt p'' (kt) = 0 
c'est-à-dire 

2 œ'(u) + u o''(u) 0) 


équation dont l'intégrale générale est 


Conditions S : 


On a vu (au Il) qu'avec a = 0 et b ©, cette solution ne convenait pas 
au problème (ler cas). 


Mais on n'a aucune raison d'imposer cette condition; en adoptant (2e 
cas) 


AU DIE X 


on retrouvera la distributiondonnée au paragraphe 3; laquelle està rejeter 
puisqu'il s'agit d'une distribution isolée et non pas d'une famille de distri- 
butions. 

Alors Y(b) -W(a) =£Z(ra)-<a =£Lr, ne dépend plus de & 


Seul subsiste donc le cas où k = 1, c'est-à-dire x = x,, où (E!') est 
vérifiée d'emblée, sans que cela implique que (D'') le soit, 


Concluons donc que seule la condition nécessaire de M. Fréchet s'é- 


tend, sans aucune restriction, aux familles de distribution à un nombre 
quelconque de paramètres, 


(1) Note : En particulier, avec 


at @::\, BTE 1 
pt) = r-1 RE. il DE 
on a ; 
nl 
p(xt) = 2-1 Lr.kt 
donc 1 1 
œ(kt) = p(t) Pet die 1 


[Ll 
ES 
S 
+ 
x 
|: 
(es 
8 
H 
Hilo 
[a 
IE 
a 
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5°)- REMARQUE : 


La possibilité de courbes de concentration confondues avec les seg- 
ments 


Op q = 0 
Pl DMC 
ul 


n'apas éténon plus envisagée ; c'est uncas limite acceptable de(t)= xl 


6°)- THEOREME : 


S'il existe une famille de courbes de concentration qui se prêtent à 
l'agrégation, elles sont nécessairement tangentes entre elles aux deux 
extrémités de leur arc(p=q=0;p=q= 1). 


Démonstration : On a établi au n° 2 qu'on avait 
AIRES AX bre} XŸ= BX 
et on vient de démontrer que x = x, = X ; d'où il suit que 
a = a, = A b =b, =B 


Une conséquence : la famille de distributions de l'exemple 3 (voir à la fin 
de la lère partie ci-dessus) ne se prête pas à l'agrégation, puisque a et b 
dépendent de & . 


Effectivement on a : pq + € p (l+e) q = 0 
et en dérivant : pqa'+q+e -(l+e)q'=0 
d'où pour |“p = qd =0 a dui-e A(ULEe) 
p=gq=l h=g'=(1+e<)/e 


7°)- CONSTRUCTION DES FAMILLES DE DISTRIBUTIONS QUISE PRE- 
TENT A L'AGREGATION - Familles à 1 paramètre - 


Reprenons le procédé du n° lab ci-dessus, avec 2 courbes fixes de 
concentration g et g, ayant un contact aux 2 extrémités (d'après le 6°), en 
supposant X et x, fixes et en outre égaux (d'après les 3° et 4°), et en fai- 
sant varier le rapport des effectifs : 


À = m,/m 
La relation (D'') détermine une fonction ® de t,variant de 0 à 1: 
= 2 +À. 1 
CFE ue 


et il est immédiat que,sur l'autre axe des coordonnées, on a de même 


__p+AP 


(À au lieu du p figurant dans Q enl-3°). Autrement dit, à chaque À cor- 
respond une courbe de concentration Get une seule, définie géométrique- 
ment comme suit : 


s 


a) On mène la tangente à g et celle à g, de pentet; 
b) On joint les 2 points de contact c et c;; 

droi te péit orte1 aus Che :; 
c) On prend sur la droite cc4, le poin q a Tee 


d) On fait varier t (de a jusqu'àb) de façon quec décrive g, c, décrive 
get C décrive GX. 
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En particulier Go est g et Goest g1. 
Il reste cependant à démontrer que la famille G1 se prête bien à l'a- 
grégation. 


Ceci résulte du seul fait que, quelque soit À , la tangente à G\en Ca 
la même pente t (indépendante de À ), comme on va l'établir. 


En effet = C +UPp; 

donc dc; = dc +d(üp) avec dé, = de , 
c'est-à-dire d(üp)=0 

Mais C=c+ap(\/141), 

donc aC = de + d{(up) (A/1 +à) 

donc dC = de. 


Ce point établi, il est immédiat que l'agrégation portant sur Gr et 
G, avec des effectifs Mo et M, redonnera une courbe de la famille G (en 
supposant toujours les moyennes identiques). 


Conclusion : Etant donné deux courbes de concentration arbitraires g et g, 
mais en contact aux extrémités, la famille Gàdéfinie par les conditions 


TC = c& (ÀA/1+) avec dé = d® , 


se prête à l'agrégation à moyennes égales. 


Réciproquement s'il existe une famille de distributions se prêtant à 
l'agrégation : 
les moyennes des distributions sont égales entre elles, 
les courbes de concentration ont un contact entre elles aux 2 extré- 
mités, 
toute courbe de concentration de la famille peut se déduire de 2 cer- 
taines d'entre elles par le procédé décrit précédemment, 
Exemple : Avec notre exemple 3, on avait : 
qg=(1t+te)t -e - pt», 
q(p-1l-e) +ep = 0, 


d'où p=l+te- CE 
Ei(1+e 
posons 1 +, - À ; 22p 4 (t)e 
__E +ÀEs , 
DéÉra 
| À 
il vient IE + = ; 


avec e(1te)+ SERRES 


Il n'y a aucune raison pour que cette dernière expression soit identi- 
que à 


de RAR QE E(1+E). 
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Autre exemple (dû à M. MALINVAUD) : Avec une loi de Pareto, on a : 
p=1- [a/(x-1) t]* =œ(t) 


Si l'on prend une 2ème loi, de paramètre il est clair qu'on a 
Ph Puson sb BG 
HG TASSE 
et qu'on ne peut trouver A tel que la parenthèse soit de la forme 
D 
t 


8°)- PROBLEME 


Reconnaïitre si une famille de courbes de concentration {à 1 paramètre 
&) correspond à des distributions qu'on peut agréger (sous réserve queles 
moyennes soient égales). 


Solution : On éliminera le paramètre «à entre les équations 
g(a ;p,q) = 0 
g,(æx;p,q) +t gu(x ; p,q) = 0 
Le résultat de cette élimination doit représenter (entre autres) une 
droite (pour chaque valeur de t = dq/dp). 
Exemple : Faisceau de coniques bitangentes en (p=q=0), (p-q=1). 
g(p,a) = q(1-p) + « (q-p)° = 0 
Ces coniques ont un arc (0< p<1, 0 <q < 1) qui satisfait à la condi- 
tion nécessaire de contact aux extrémités. Les distributions correspon- 
dantes seraient-elles susceptibles de s'agréger? 
La 2ème équation s'écrit : 
[t(1-p)-a]+ 2a(q-pht-1) = 0 


L'élimination de &« donne : 


(1) d'Ap = 0 
équation d'une droite qui ne convient pas : 
(2) 2(t-1) a(1-p) - (a-p)[t(1-p)-a]= 0 
équation d'une conique qui se décompose si elle a un point double : 
(A) -2(t-1) q +t(1-p) -q +(q-p)t = 0 Equations 
(3) 2(t-1) (1-p)- t (1-p)+q + aq - p= 0 } du point 
double 
(c) 2(t-1) q -t(q -p)= 0 
(A) et (C) donnent (U) t{i=p}= di 0 
(B) et (U) donnent (V) 2(t-1)(1-p) +(q-p) = 0 
PTE 
V) et (C) donnent =22 9-1 
“ti MG st p=1,q=0,p=q 


alors que (U)donne 


Conclusion : Il n'y a pas point double;lefaisceau de coniques ne représente 
donc pas des distributions qui peuvent s'agréger. 
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9°) CONSTRUCTION DES FAMILLES DE DISTRIBUTION QUI SE PRE- 
TENT A L'AGREGATION - Familles à plusieurs paramètres. 


Le procédé n° 7 s'étend à un nombre quelconque de paramètres. Par 
exemple, sig, est une 3° courbe de concentration ayant un contact en ses 
extrémités avec g et g, et n'appartenant pas à la famille G;, on peut cons- 
truire une famille de courbes de concentration Gr à 2 paramètres en 
posant maintenant 


P + _P+AP: 
Er Le LR PE 
À 
Q + 2 Med à Nr 
Q ne Tr Q = 1 +AÀ à 
c'est-à-dire : 
P=aep+Py+ Yo, ANA RER 
2 =awp+pb,+ Yo 
avec 
l À u 
ass Pen = 
(1+A) (1+u) (1+A) (I+u) 1+u 


On démontre de même que : 


L'agrégat des distributions (G;,,X)1 et (G,,,X)u est de la forme 
(G wyrs X)m+m + Il est plus commode d'employer les 3 paramètres af y 
que les 2 paramètres Àl ; en posant 


a a ' "4 
M'/M - p » les 3 paramètres de l'agrégat sont ( I = ‘ ee 
de somme ll. 


10°) RETOUR A LA LOI DE DISTRIBUTION : p = w (t) = w es) 


Etant donné les lois de distribution p{x), p,(x), p,(x), on retrouve un 
résultat très banal : 


“CP PE Mie, (avec «x +B+Y = 1) 


On retrouve en même temps un théorème, essentiel pour d'autres 
problèmes d'agrégation : 


Pour qu'on ait une identité de la forme 
F(x;r )+AF(x,rs) = (1HA)Fx,R(r,r,)] 
il faut et il suffit qu'on ait 
F(x;r) = Fi(x) + G(r)F2(x) 


Ce théorème s'établit en dérivant l'identité par rapport au paramètre r 
et en constatant que (log F'r - logFi# ) est indépendant de x. C'est à M. 
BAUDIER que nous devons de faire ce rapprochement entre les 2 théories 
et de pouvoir énoncer finalement que : 


Se prêtent seules à l'agrégation les combinaisons linéaires de distri- 


butions ayant même moyenne et même intervalle de variation (en nom- 
bre quelconque d'ailleurs). 


SUR LES AGREGATS DE DISTRIBUTIONS STATISTIQUES D'UNE MÊME FAMILLE SI 
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4) - REFERENCES CONCERNANT L'AGREGATION DES LOIS DE DIS- 
TRIBUTION 


Le théorème de M. FRECHET dont il est ici question était encore 
inédit : M. Fréchet nous avait confié ses notes manuscrites. Il emploie 
l'expression ‘mélange de populations''(qui est synonyme d'agrégation). De 
même M. FONSAGRIVE n'a encore rien publié sur ses recherches. 

M. HUBER - Eléments de Technique Statistique, 1943 - parle du problème 


du mélange des populations (page 134). Il cite à ce propos des travaux 
très anciens : 


Alphonse BERTILLON et sa courbe à 2 sommets pour la distribution 
des tailles des conscrits du Doubs en 1951-1859, décomposée en 
2Courbes . 


Karl PEARSON et la courbe des décès par âge décomposée en 5 cour- 
bes normales. 


La question du mélange des populations est mentionnée dans tous les 
traités de statistique antérieurs à 1940. 


Par exemple: 


Udny YULE - An introduction to the theory of statistics (lle ed. 1937). 
p. 103, Complex distributions. 


RISSER et TRAYNARD - Les principes de la statistique mathématique 
(traité de calcul des probabilités de M.E. BOREL, 1933, le partie, 
chapitre V - Partage des courbes de fréquence. 


En revanche KENDALL (1947) la passe sous silence. Et CRAMER 
(Mathematical methods of statistics, 1946) mentionne seulement (page 56) 
le cas où on mélange deuxdistributions, l'une continue, l'autre discontinue, 
Ce problème de statistique n'est donc redevenu actuel que comtne cas le 
plus simple d'un problème général d'économétrie .{1) 


Nota Bene : Il y à lieu de ne pas confondre le mélange des populations avec 
le produit de plusieurs lois de probabilité, c'est-à-dire l'addition de plu- 
sieurs variables aléatoires, question passée au contraire au premier plan 
du calcul des probabilités. 


(1) Exemple d'article récent où il est question de mélan i 
ge de population : H, M . 
RES of symmetry in the skewed income curve (OPA Stat. Assoc MAIS 
p.55 ; Ï 


LES VALEURS MEDIANES 
ET LA THÉORIE DE LA MESURE 


par 


Carlo BONFERRONI 


SOMMAIRE : 


Moyennes et médianes pour des valeurs discontinues; médiane d'une 
série et convergence ''en médiane''. Fonction déterminée dansun intervalle 
fini; ses ''permutations'' définies moyennant les ''mesures'' de certains 
ensembles ; permutations ''au sens étroit''. Définition de la ‘fonctionnelle 
symétrique'' ; l'intégrale et lamoyenne arithmétique sontdesfonctionnelles 
symétriques. La permutation croissante et la permutation décroissante ; 
détermination de la médiane, des terciles, quartiles, etc ... Propriété 
de minimum de la médiane, Moyenne pondérée de la fonction; pondération 
à attribuer à la permutation croissante - Une moyenne pondérée est une 
fonctionnelle symétrique. Permutation croissante etvaleurs médianes pour 
une fonction de deux variables ou plus. 


1 - Beaucoup devaleurs moyennes de n observations x1, .., Xn sont expri- 
mées par une fonction f(x, ..., xn) qui est une fonction analytique et qui 
pour cetteraison se prête facilement à des transformations mathématiques. 
Ceci n'a pas lieu pour les valeurs ‘''médianes!'' (médiane, terciles, quar- 
tiles, etc ...) bienqu'elles aient de remarquables applications en statisti- 
que et ceci dépend évidemment du fait qu'elles sont déterminées après une 
opération préliminaire de rangement (par ordre croissant ou décroissant) 
qui ne correspond pas à une fonction analytique, et même, ne se prête pas 
à une représentation symbolique systématique dans notre construction 
mathématique actuelle. Il s'ensuit que les problèmes relatifs aux valeurs 
médianes présentent des difficultés particulières et exigent des procédés 
qui s'écartent souvent notablement des procédés courants. 


Je m'occuperai, en particulier, de la détermination des valeurs mé- 
dianes quand le nombre des éléments x,, ..., xnaugmente indéfiniment. 
Ce problème déjà résolu pour de nombreux types de moyennes, mérite 
aussi d'être étudié pour les valeurs médianes non seulement à cause des 
applications pratiques, mais aussi en raison des tendances naturelles de 


l'esprit mathématique. 


2 - Les moyennes les plus importantes acquièrent une signification statis- 
tique parce qu'elles résolvent le problème de l'égale répartition (équi- 
répartition d'une certaine grandeur) entre n sujets. La formule mathé- 


(1) Traduction de la Conférence ‘I valorie la teoria della misura'' parue dans la 
revue ''Giornale di Matematica finanziara'' anno XXXVII - Vol I - 1955 - pp 89-153. 
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s 


matique générale de ce concept (1) conduit à établir que si la grandeur a 
respectivement les valeurs x,, ..., xn pour chacun des sujets considérés 
et la valeur f(x, ..., Xn) pour l'ensemble qu'ils constituent, la moyenneet 
la valeur commune f,, qui conduit à la mêmevaleur collective,c'est-à-dire 


qui satisfait à la condition : 


(1) recule OMS CPE 
dont on pourra tirer (sous certaines conditions concernant la fonction f) 
(2) Un = 8x1, POS EN) à 


Si f est symétrique par rapport aux xs, g le sera aussi et l'on pourra 
dire que u, est la moyenne symétrique des xs. Dans les cas plus courants 
et importants f a la même forme. 


(3) f(x, 4 En) = Pa) +... FO Col: 


les x; sont soumis à la même opération @ et les résultats sontadditionnés. 
Les moyennes qui en dériventpeuvent être ditesde type arithmétique;elles 
sont évidemment symétriques. 


La médiane ne résout pas un problème d'équirépartition; elle aussi 
pourtant est une moyenne symétrique, parce que, quel que soit l'ordre 
suivant lequel les xs sont donnés, elle est déterminée à la suite d'un ran- 
gement par valeurs croissantes (ou décroissantes). 


3 - Considérons d'abord une suite infinie x, x, ... par la moyenne de 
tous les xs on est amené à définir la limite (si elle existe). 


= lim 
HN ar 
Un étant calculé au moyen des n premiers éléments x,,...,xn.Si en chan- 
geant l'ordre des xs ne varie pas, celle-ci est une moyenne symétrique de 
l'infinité des valeurs xs dépendant de leur ensemble et non de leur ordre 
de succession. Si un est calculée au moyen de la formule (3) on aura 
(x) +... +p(xr) 


lim æ (ln) = lim Ÿ = = lim @ (xn) d'où 


Si lim xhexiste et si est une fonction continue. 
lim pn= lim xs. 


Dans ces hypothèses la moyenne est donc symétrique car un ordre 
différent des xs ne change pas lim x,. Il se peut toutefois que lim u, existe 
sans qu'existe lim xn; on a alors la limite de xnen moyenne (de type arith- 
métique sur la base de @) ; en particulier en moyenne arithmétique, qua- 
dratique, harmonique, géométrique, etc 


4 - On peut donner une définition analogue pour la médiane en prenant la 
lim ph, avecun médiane des premières valeurs x, ..., Xn. Si lim Xn= x 
existe on aura lim y, = x : en effet étant donné € >> 0 pour n plus grand 
qu'une certaine valeur xo, on aura [xn- x|<e et par suite, pour n>2n» 
on aura | Un - x| < €. Dans ce cas la médiane est une fonction symétrique 
de l'infinité des xs. Mais il peut arriver aussi que la médiane un tende 
vers une limite alors que xn ne tend pas vers une limite : lim un est alors 
la limite en médiane de xn. Par exemple la série indéterminée 


0,0,2,0,2,0,2, 0,2, 


(1) J'ai exposé cette idée en 1923 cf ma note : A proposito di espressioni generali 
per le medie, Giornale degli Economisti - Mai 1937, 
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a la limite Len moyenne et la limite 0 en médiane. En supprimant le pre- 
mier zéro, la nouvelle série garde la limite L en moyenne mais n'a pas de 
limite, en médiane, Par contre, la série indéterminée 


050%2,0,/-22, 076,0 -06,0,10,0, -210,0;.14,0,%% 14; 


n'a pas de limite en moyenne mais la limite 0 en médiane; si on supprime 
le zéro initial elle n'a pas de limite ni en moyenne ni en médiane, 


5 - Le nombre des xs devient infini en posant aussi sa fonction x fonction 
de la variablet dans l'intervalle a-b : la fonction f, qui définit la moyenne 
devient fonction de la ligne y = x{t), c'est-à-dire une fonctionnelle F x (t). 
La moyenne correspondante s'obtiendra en posant 


(4) Fu EF x(t) (p = constante) 


Par exemple, si F est l'intégrale de x(t) dans l'intervalle a - b, onaura 


b b b 
fua- [ x(t) dt , ml x(t) dt 


c'est-à-dire la moyenne arithmétique des valeurs prises par x(t). Si Fest 
l'intégrale de x(t) p (t) on obtiendra la moyenne arithmétique pondérée de 
x(t) avec un poids p(t)dt(élémentaire). En généralon pourra de la formule 
(4) déduire comme fonctionnelle de x({t). Nous nous proposons avant tout 
d'étendre à ce cas la définition de moyenne symétrique. 


6 - Permutation d'une fonction - 


Puisque la moyenne est une fonctionnelle de x(t)nous devons détermi- 
ner quand une fonctionnelle est symétrique par rapport à la fonction xt), 
c'est-à-dire ne varie pas si on substitue à x(t) une fonction x;(t)représen- 
tant un simple changement dans l'ordre de l'infinité des valeursprisespar 
x(t)dans l'intervalle a-b, c'est-à-dire en somme qui soit une permutation 
de x(t). Pour une série x14, x, ..., modifier l'ordre des termes signifie 
considérer une nouvelle série contenant les mêmes termesrépétés le mê- 
me nombre de fois (finiou infini) cepentdant, cette condition simple ne peut 
pas s'appliquer à une fonction x(t) parce qu'unecertaine valeur y peut être 
prise parx(t)en tous les points, par exemple, d'un plurintervalle(interval- 
le composé d'un nombre fini ou infini d'intervalles disjoints). Il est toute- 
fois naturel dans ce cas de considérer la longueur du plurintervalle (obte- 
nue par l'addition, finie ou en série, des longueurs des intervalles par- 
tiels). Seulement, Le recours aux plurintervalles n'est pas toujours suffi- 
sant, car il existe des ensembles qui ne sont pas des plurintervalles. 


Un concept plus général est donc nécessaire : il nous est offert par la 
mesure d'un ensemble, selon la fameuse définition de Lebesgue. 


En indiquant par mes I(x< y) la mesure (supposée existante) de l'en- 
semble occupé par les points t qui font x(t)=y, et de façon analogue x,{t), 
il est nécessaire d'établir que x(t) est une permutation de x(t) si l'on a 


quel que soit y 
(5) mes I(x<y) = mes I (x, y) 


Il en découle aussitôt 


(6) mes I (x'= y) = mes I (x, = y) 
En effet ceci peut s'écrire 


mes I(x<<y) - lim mes I (x<z) - 
mes I (x; <C y) - lim mes I (x, << z) 
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où les limites sont calculées pour z croissant et tendant vers y et où elles 
existent parce que mes I(x< y) et mes I(x,  z) sont fonctions des mono- 
tones (non décroissantes) de z. 


s 


Ii est utile d'observer que l'égalité (6) ne suffit pas à définir une per- 
mutation(comme on pourrait aupremier moment le supposer)parce qu'elle 
n'entraine pas l'égalité(5) pourtant nécessaire : on peut en donner un exem- 
ple avec les deux fonctions x(t), x4(t) croissantes dans l'intervalle a-b de 
A à B de façon que par exemple x(t)=> x41(t)- c'est pourquoi nous prendrons 
l'égalité (5) pour définir les variations de x(t). L'égalité (5) n'oublie pour- 
tant pas x{t) à prendre les mêmes valeurs que x(t).Si en effeton transfor- 
me arbitrairement x(t)en un ensemble demesure nulle, la nouvellefonction 
xit) vérifie l'égalité (5). Si on ajoute alors la condition que x4(t) et x(t) 
assument les mêmes valeurs et plus précisément que I(x = y) et I(x, = y) 
aient la même mesure (ou ''puissance!'', c'est-à-dire peuvent être mis en 
relation biunivoque), on obtiendra une permutation au sens étroit. Pourtant 
par la suite, les propriétés établies seront valables pour n'importe quelle 


permutation. 


7 - Fonctionnelle symétrique - 


De même qu'une fonction de x,,.,.., x est symétrique si elle ne varie 
pas quand on change l'ordre des variables, de même, par extension natu- 


relle, je dirais qu'une fonctionnelle de x(t) est symétrique si elle reste 


s 


invariée quand on substitue à x(t) une de ses permutations,. Et la fonction- 
nelle sera seulement symétrique au sens étroit si elle ne varie pas pour 
une permutation au sens étroit (mais peut varier pour d'autres permuta- 
tions). Par exemple les extrêmes de x(t) en a-b sont fonctionnelles symé- 
triques au sens étroit parce qu'une permutation générique peut prendre 
des valeurs non comprises entre des extrêmes de x(t). 


La symétrie ainsi définie se ramène à une fonctionnelle d'une seule 
fonction - Pour une fonctionnelle F de n fonctions on pourra revenir au 
concept ordinaire de symétrie c'est-à-dire à l'invariabilité de F pour un 
changement d'ordre dans les fonctions; mais si le nombre des fonctions 
devient infini, on pourra considérer la symétrie par rapport àces fonctions 
infinies; et ceci ramènera à des problèmes du type précédemment traité. 


8 - La somme den nombres estune fonction symétrique de ceux-ci;à cette 
propriété correspond la suivante : l'intégrale de x(t) est une fonctionnelle 
symétrique. Il faut naturellement considérer les intégrales dans le sens de 
Lebesgue, parce qu'une perimutation de x(t), et x(t) même pourraient ne 
pas être intégrables au sens classique, 


La démonstration se déduit immédiatement du processus même de la 
construction del'intégrale de Lebesgue , En effetsi on introduitles mesures 


m(y) = mes I(x< y) ; M(y) = mes I(x> y) 
my) = mes I(x=y) m(y) +M(y) = b - a 


et si on indique respectivement par A et B les limites extrêmes inférieure 
et supérieure de x(t) dans l'intervalle a - b, l'intégrale de Lebesgueest 
définie, en substance, par une intégrale de Stieljes : plus précisément 


b B 
(7) ft dt [> dm (y) [e>0 arbitraires] 


Cette intégrale existe, parce que m(y) est monotone. Il résulte de là 
qu'une permutation au sens étroit ne modifie pas l'intégrale, parce qu'elle 
ne modifie ni m(y), ni À ni B. Pour démontrer, ensuite, que la propriété 
demeure valable pour n'importe quelle permutation il faut remplacer A, B 
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s 


par deux autres quantités. Notons à cet effet que si les valeurs x(t)>Bo; 
se trouvent sur un ensemble de mesure nulle, pour y>Boon a M({y)= 0, 
m(y) = b-aet par conséquent dm(y) = 0 ; de même si on a x(t) < À, pour 
les points t d'un ensemble de moyenne nulle, pour y < A, on a m(y) = 0 et 
dm(y) = 0 : il suffit pour cela d'intégrer de Aç-€ jusqu'à Bo. Considèrons 
alors la plus petite valeur B, de B, et la plus grande valeur A; de À,, et 
appelons les respectivement extrêmale supérieure et extrêmale inférieure 
de x(t) dans l'intervalle a-b : on aura évidemment 


Be Air Dies ER 


et on pourra retenir dans le calcul de l'intégrale par la formule (7) le fait 
que À et B représentent les extrêmales de x({t) au lieu des extrêmes (1). Il 
est clair que x(t) et une de. ses commutations x4(t) ont les mêmes extrêma- 
les (sinon les mêmes extrêmes);donc, en vertu de la formule (7) elles ont 
la même intégrale. 


9 - Il est bon d'établir, pour ce qui suit, que l'intégrale de x(t) est aussi 
une fonctionnelle symétrique. Il suffit de remarquer qu'évidemment les 
extrêmales de| x{t) | et de | x;(t)| coincident ; 


mes I( |x} y) = mes I(-y<x< y) = m(y) - 
- m(-g) +m (-y) 
et que le dernier membre n'est pas modifié en passant de x({t) à x.(t). 


10 - Nous devons ajouter et nous en tirerons parti plus loin que la fonction 
my) est continue à droite et discontinue à gauche seulement si m(y) > 0, 
avec un écart égal à m(y). En effet si on désigne par m(y+), et m(y-) les 
limites à droite et à gauche de y, il résulte de fait que m(y) tient compte 
aussi des points t qui rendent x(t) = y : 


m(y+) - my) =0, my) - m(y-) = m(y) 
Puisque M{y) = b - a - my), M(y) aussi se comporte comme m(y). 
11 - La permutation croissante - 


Si x(t) est monotone (croissante ou décroissante) la médiane est évi- 
demment la valeur de x(t)au point moyen de l'intervalle a - b;les terciles, 
quartiles, etc ...s'obtiennent de la même manière, endivisant l'intervalle 
en 3,4, ..., parties égales. Quand x(t) n'est pas monotone il faudra la 
transformer en une fonction monotone c'est-à-dire construire la permu- 
tation croissante xc(t), ou bien décroissante xy(t) = c'est sur elles ensuite 
qu'on déterminera les valeurs médianes. 


Pour avoir xç(t) nous donnerons la valeur y à tous les points de l'in- 
tervalle ayant pour extrêmes 


(8) ty=a+m(y) , t,- my), 


intervalle contenu dans celui a - b et de longueur my). Si m(y) = 0, les 
ordonnées du diagramme de x(t) égales à y se rencontrent toutes sur le 
point t,, donc, si elles sont deux ou plus, le xe(t) ne donne pas une permu- 
tation au sens étroit le point ty sera comme m(y) fonction monotone de y, 
continue à droite; et discontinue à gauche avec l'écart m(y) seulement si 
my) = O (voir n° 10) - Le diagramme de x,(t) vient coincider en corres- 
pondance avec l'intervalle dit plus haut, avec un segment parallèle à l'axe 


t de longueur m(y). 


(1) Cette simple opération peut souvent être utile (par exemple dans l'application du 
théorème de la moyenne). 
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Si on écrit à la place de ty et si on résout par rapport à y l'équation 
(9) t=a + m(y) 


on aura l'équation y = xç(t) de la permutation croissante, en tenant compte 
du fait que, lorsque m(y)> 0, xc(t) reste constante et = y sur tout l'inter- 
valle (8). Ceci entraine xç(t), fonction monotone croissante à être aussi 
une fonction continue. Il faut encore observer que si mes l{(y<x<x +h) 
m(y) reste constante quand y parcourt l'intervalle y- y+h ; la courbe de 
xolt) acquiert alors un règlement parallèle à l'axe y et par suite sur le 
point t correspondant, la fonction xc(t)devient plurivalente. Ce fait, comme 
nous le verrons, a de l'importance pour la détermination de la médiane. 


On définit de façon analogue la permutation décroissante x d(t). Son 
diagramme évidemment, est le symétrique de celui de la xc(t),par rapport 
à l'axe du segment a - b. 


Un problème d'hydrostatique - et précisément l'équilibre d'un liquide 
à couches horizontales de diverses densités, qui s'obtient quand les densi- 
tés se disposent par ordre croissant vers le bas a amené C. SOMIGLIANA 
(Sulle funzioni reali di una variabile (1) ; sulle funzioni ordinate*) à cons- 
truire (au moyen de considérations sur les limites) la permutation crois- 
sante d'une fonction continue f(x), appelée par lui ‘'fonction ordonnée! de 
f(x). Dans une lettre à C. SOMIGLIANA, V. VOLTERRA (voir la seconde 
note citée) étendit le procédé à des fonctions discontinues. L'étude fut 
reprise par F .SIBIRANI (sulle funzioni ordinatrici(2) qui utilisa le concept 
de mesure toujours pour des fonctions continues, et indiqua les difficultés 
que présentent les fonctions discontinues . Dans la présente étude onconsi- 
dère toutes les permutations et en particulier la permutation croissante, 
sans exclure la possibilité qu'elle soit plurivalente. La statistique examine 
souvent des fonctions plurivalentes : par exemple une table à double entrée 
est l'expression au sens mathématique formel, d'une fonction plurivalente, 
et de son inverse. 


12 - Puisque la mesure jusqu'à y, c'est-à-dire m{y), et la mesure pour y, 
c'est-à-dire m(y), sont les mêmes pour x(t) et pour une permutation x,(t) 
il est clair que x(t) et x;(t) conduisent à la même permutation croissante. 
Soit alors une fonctionnelle F x{t) et F x(t) = F xç(t) quel que soit x(t) : on 
aura aussi F x4(t) = F xc(t), d'où F x(t) = F x(t) et la fonctionnelle sera 


saire et suffisant qu'elle ne varie pas lorsqu'on substitue à x(t) sa per- 


mutation croissante. 


13 - Médiane 


Puisque xç(t) représente x(t) rangé suivant les valeurs croissantes, la 
médiane est la valeur de xç(t) située au milieu de l'intervalle a-b. En se 
reportant au diagramme, on peut dire que les ordonnées qui précèdent 
l'ordonnée médiane et celles qui la suivent portent sur des ensembles de 
mesure égale (la moitié de l'intervalle a - b), 


Si l'axe du segment a - b rencontre le diagramme en un seul point, il 
y à une seule valeur médiane ; s'il contient un segment parallèle à l'axe y 
et faisant partie du diagramme (V n° 11) il y aura tout un intervalle de 


(1) SOMIGLIANA - Sulle funzioni reali di una variabile, 
1899, 1° sem, 
Sulle funzioni ordinate, id - 2° sem. 


R. Accademia dei Lincei, 


(2) SIBIRANI - Sulle funzioni ordinatrici, R,. Accademia dei Eincer, 19 ee 


Acc. d. Sc. di Bologna, Mem, 1948. A 
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valeurs médianes. Cependant x(t)ne prend pas toutes ces valeurs, car les 
ordonnées x(t) comprises dans l'intervalle médian portent le plus souvent 
sur un ensemble de mesure nulle (souvenons-nous que m(y) reste cons- 
tante quand y varie dans l'intervalle médian). 


Un nombre fini d'éléments peut aussi conduire à un intervalle médian, 

comme il est bien connu : ce sont pourtant seulement les deux limites 
extrêmes, de cet intervalle qui appartiennent au groupe d'éléments donné. 
Si on divise l'intervalle a - b en trois, quatre, ..., parties égales, les 
ordonnées aux points de division donneront les deux terciles, les trois 
quartiles, ... ; et un intervalle tercile,un intervalle-quartile, ..., pour- 
ront être formés. Si on construit aussi le diagramme de xa(t); la médiane 
(unique ou intervalle) constitue l'intersection des deux courbes de x,(t) et 
de xd(t). 
14 - Propriété de minimum. Dans le cas discontinu, il est pour ainsi dire 
évident que la médiane rend minimale la somme des écarts absolus. S'il y 
a un intervalle médian, ceci a lieu pour tous ses points (1). Comme on peut 
le prévoir, cette propriété se vérifie aussi dans le cas continu. 


Soit en effet, 


b 
S(z) = ! Ix(t) - z | dt 


la somme (intégrale) des écarts absolus de x(t) pour z; puisqu'une permu- 
tation de x(t)ne change pas l'intégrale de x(t)- z ni même celle de |x(t) - Z | 
(v. n° 9), nous pouvons substituer xç{t) à x(t). 


Comme xe(t) est monotone, croissante, nous aurons : 


s(2) = [mt ay + [ My) ay 


Les dérivées droite et gauche de S(z)sont (2), étant donné H(z)=m{(z) -M(z) 
(fonction monotone croissante). 
S'(zt+)=H(z) , S'(z-) = H(z-) 

Si z précède la médiane (ou les médianes) on a H(z)<0; et aussi H(z-)< 0 
parce que H(z-)<< H(z).Si z est supérieur à la médiane, il résulte au con- 
traire H(z)>0 ; et aussi H(z:) > 0 parce que, pour y compris entre z et la 
médiane, on a H(y)=> 0 et croissant. Les dérivées droite et gauche étant 
négatives avant la médiane, positives après et nulles dans l'intervalle 
médian (s'il existe, dans cet intervalle : m = M) on conclut que S(z) dimi- 
nue quand z croit jusqu'à la médiane, que Sz reste constant quand z par- 
court l'intervalle médian (s'il y en a un ) et ensuite croit avec z. 


15 - Fonction pondérée : 


Supposons que l'on attribue à x(t) un poids (élémentaire) p(t)dt et for- 
mons la moyenne pondérée 


b b 
Mp # x(t) p(t) at} fro dt: 


(1) - X, ... xn étant donnés par ordre croissant, la somme des deux écarts absolus 
de z pour x,et xnest minimale quand x,< z < Xn; de même, quand x, € z € Xn-1 la somme 
des écarts entre x, et xn-1, etc ... est minimale, Ceci conduit à placer z sur la médiane 


ou bien sur l'intervalle médian. 


(2) On démontre facilement que siF(z) a une limite droite (gauche) en z, cette limite 
est la dérivée droite (gauche) en z de l'intégrale de F en a z. On se souviendra aussi que 
m(y) et M(y) sont continues à droite (n° 10). 
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nous nous proposons de vérifier qu'une permutation de x(t) laisse Mp in- 
changée. Cette propriété, évidente pour le cas discontinu - parce que 
toutes les valeurs x; portent avec elles, dans un déplacement, leur propre 
pondération ps, on peut faire ensuite la somme des coefficients de pondé- 
ration de valeurs successives égales-n'est pas évidente dans lecas conti- 
nu, car il est nécessaire avant tout d'établir quelle est la pondération 
p.(t)dt à donner à la permutation x,(t). 


Nous commencerons par étudier la permutation croissante xç(t) en 
déterminant le poids p.(t)dt qui lui est attaché. Sur le segment at, x(s) 
absorbe i'ensemble I(x<<y), car y = xe(t) : c'est-à-dire dans l'hypothèse 
my) = 0. Mais si m(y)—>0, il en résulte que xc{t) est constante = y dans 
un intervalle & - fi de longueur m(y) ; le segment a” «a contient l'ensemble 
I(x< y) et le segment a” B , ce même ensemble et en plus I(x = y). C'est 
pourquoi, pour a t fi nous attribuerons au segment a” t le poids total 
de I(x< y) plus une partie du poids de I(x=y), proportionnelle à t - &« = 
c'est-à-dire nous poserons : 


E 
(10) [ E.(s)ds | p(s) ds + 6 = : Î p(s) ds [y = Re 
a X<y X=y 


Pour t = b, on a évidemment (B représentant l'extrême supérieure de x(t) 
dans l'intervalle a  b) 


b b 
(11) p.(s)ds -| p(s)ds +] p(s)ds - p(s) ds 
a x<B x=B a 


c'est-à-dire que le poids total n'a pas varié. Si m(y)= 0, le dernier terme 
du deuxième membre de l'équation {10) disparait. 


16 - Pour déterminer pit) il est essentiel de noter que le deuxième mem - 
bre de l'équation (10) est une fonction (t) absolument continue du moins 
dans l'hypothèse - où nous nous plaçons - que p(t) est fonction limitée en 
a” b c'est-à-direque l'on ap(t) P, P étant indépendant de t. Je montre- 
rai précisément que le rapport d'accroissement de (t) dans n'importe quel 
intervalle de a best inférieur à P ; et ceci - comme il est bien connu - 
suffira pour qu'on affirme que œ(t) est absolument continue. L'intervalle 
t” t+h (h=> 0) étant fixé, supposons pour nous placer dans des conditions 
générales que t porte sur un segment &;,- f,, dans lequel, xc(t) = cons- 
tante = y, et t+h dans à, - ff, où xc(t) = constante = y, ; et posons : 


h3= ff -t, h2= @2- 9, h3=tth - «x. 


Si t ne se trouve pas sur un segment @œ;-f, , h, = 0 ; et si t+h n'ap- 
partient pas à a, -f, , h3 = 0, puisque quant t varie dans «if; , seul le 
deuxième terme dewp(t) varie, nous aurons : 


NEO ET er p(s) ds =h;p, 


p(s) ds 3 p(s)ds -| slds=h 
X<Y9 XY1 Ya <X Yo p x ee 


——— s)ds =h 
D p(s) 15 


P, = valeur moyenne de p(s) en I(x=y,) 


Posons : 


(1) On pourrait bien entendu faire une autre convention. 
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(12) P, = valeur moyenne de p(s) en I{y, < x< y,) 
P3 
Puisque æ(t) est évidemment fonction croissante de t, les accroisse- 
ments (12) expriment les variations. En ajoutant les expressions (12), on 
obtient : 
(13) æ(t+h) - œ({t) = hip;+h2p; +h3p; =hp<hP 


p étant la moyenne de p,, p,, p,, et par conséquent, moyenne de p({t) en 
I(y, < x < y). Ceci démontre la continuité absolue de @ (t). 


(l 


valeur moyenne de p(s) en I(x=y,) 


Par suite, la dérivée p'(t) existe dans l'intervalle a”7b, sauf à la ri- 
gueur pour un ensemble de mesure nulle; et l'intégrale de '{t) est égale 
à @(b) - p(a), c'est-à-dire dans notre cas, æ(b), puisque æ(a) = 0. Nous 
poserons alors p,(t) =w'(t) dans les points de dérivabilité. Quelle que soit 
la valeur que l'on donne à p.(t) sur les points qui restent, on aura toujours 


[retsas = [ p'(s)ds =œ(t) 


et l'équation (10) sera satisfaite. Ayant ainsi obtenu une solution pour P.(t) 
on pourra en déduire d'autres en alternant pe(t) dans un ensemble de me- 
sure nulle. 


17 - Quant t est intérieur àun intervalle x — fi oùxc(t) estconstanteet égale 
y, la dérivée @'(t) se détermine immédiatement, en notant que (t}-dans 
x” ff est une fonction linéaire, représentée par le deuxième terme du 
second membre de l'équation (10). On a ainsi : 


(14) Pet) AR dé p(s)ds = constante = p 


avec bp moyenne arithmétique de p(s) dans l'ensemble I(x = y) qui a pour 
mesure m(y) = B -œ 


La coincidence de '(t) coincide avec une valeur moyenne de p{s) sub- 
siste même si t est en dehors d'un segment &«- fi, dans l'hypothèse où pt) 
est une fonction continue. En effet, l'équation (13) donne : 


œ(t+h)-œæ(t) _— 


h “te 
P = valeur moyenne de p(s) dans l'intervalle I(y< x <y ) avecy = x.(t), 
Yh = Xc(tth). Quand h tend vers 0, y, tend vers y, et l'ensemble I} tend vers 
l'ensemble I(x=y) complété par son dérivé(1). Si p(t) estfonction continue, 
il est clair que p moyenne dans I}, tend vers une valeur moyenne dans 
l'ensemble limite de Ih, formé, comme on l'a dit, de I(x = y) et de son 
dérivé. Mais la valeur p(to) en un point d'accumulation de t, quand tvarie 
dans un ensemble I, est elle aussi- en raison de la continuité de p(t) - une 
valeur moyenne entre celles que p(t) assume dans I = c'est pourquoi la li- 
mite de p, c'est-à-dire æ'(t), est une moyenne de p(t) dans l'ensemble 


NX = y). 


(1) J'applique ici, la définition de limite et de continuité d'un ensemble variable que 
j'ai exposé récemment (Alcune proprieta generali di un insieme variabile, Boll. Unione 
matem. Ital. 1954, Mars). Si I(t) est un ensemble (par exemple numérique), fonction de t, 
le point xo sera''interlimite''de I(t) pour t tendantvers to, si, étant donné e > 0 tout autour 
de to, on trouve au moins un point t pour lequel I(t) possède des éléments compris entre 
xo-Ee etxo+te .Si on trouve un intervalle entourant to tel qu'en chacun de ses points t, 
cette limitation soit valable, x, sera ‘''interlimite stable'', Les interlimites forment la 
classe ''limite'' en to, toujours existante et fermée. Si elle contient seulement des inter- 
limites stables, elle est la ‘'limite'' de I(t) et on peut dire que I(t) tend vers elle. I(t) est 
fonction continue de t en to si, elle tendvers l'ensemble formé parl(to),et par son dérivé. 
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On a supposé que œ'(t) existait en t. Mais quand elle n'existe pas on 
peut attribuer à p.(t), comme on l'a déjà dit(n° 16), une valeur arbitraire : 
nous donnerons encore à p,(t) une valeur moyenne entre celles que p(t) 
assume en I(x = y) (par exemple la demi-somme des extrêmes);que nous 
pouvons donc, conclure en général que si la densité de pondération p(t)est 
fonction continue de t, on peut satisfaire à la condition ( 10)avec une densité 
pelt) qui est une moyenne des densités p(s) sur les points qui rendent 


À = 1 — — ——— —— ———— — EE — 


x(s) = xe(t). 
Si, en particulier, p(t) = constant = 1, on pourra aussi poser P.(O'=tle 


18 - La structure de la moyenne pe(t) peut être précisée dans les cas plus 
courants, correspondant aux hypothèses que nous allons maintenant indi- 
quer. 


Supposons que x(t) aussi soit fonction continue : y une fois fixé, sien 
un point on a x(s)Ly, il existera tout autour de s un intervalle dans lequel 
x(s) est encore y, et de ce fait, l'intervalle I(x-< y) se composera d'in- 
tervalles (en nombre même infini) disjoints, qui pourront être disposés en 
série tint, ts mt, . 


Si m(y)=—0, un segment à - B est formé dans lequel x.{(t) est constant 
= y et comme on l'a vu (n° 17) p,(t) est la moyenne arithmétique simple de 
p(s) en I(x = y). 

Si, en revanche, m(y) = 0, le point t où xç(t) = y est (comme on l'a vu 
aurnol1): 


(15) t=at+mes I(x< y) = a + X (tr; - t1) 
t 

Faisons, maintenant, varier t dans un intervalle qui l'entoure © , et 
supposons - comme il advient généralement - que l'on ait toujours m(y)= 0: 
les points tj varieront en conséquence, et en particulier toi croitra avect, 
tandis que t;1 décroitra.Notons que si y représente un maximum (relatif) 
de x(s), deux points toi, tai coincident et cessent d'exister si t augmente: 
il faudra, alors, prendre une marge © seulement à gauche; et, de la façon 
analogue, seulement à droite si y est un minimum de x{t). Si on prend © 
par le côté opposé on pourra avoir un résultat différent (comme l'exemple 
au n° 22 le confirmera). 


En supposant que x(t) soit une fonction dérivable, on aura y = x(ti), 
fonction dérivable de tj ;donc, dans © , ti sera aussi dérivable par rapport 
à y ; par conséquent, en vertu de l'équation (15), t sera une fonction déri- 
vable de y(en supposant que si la somme devient une série,elle sera déri- 
vable terme par terme) ; et enfin, y sera dérivable par rapport à t. Mais 
alors, ti aussi sera une fonction dérivable de t;et l'expression(15) pourra 
donc être dérivée par rapport à y comme par rapport à t.En général, nous 
pouvons écrire(en remarquant que t,; croît et que toi décroît quand t croît) 


(16) dt = 2° (dtoi - dtrin) = D |dtil 


Si on divise par dt et si on indique par t! la dérivée par rapport àt,on 
de 


(17) En tr] 


Si, au contraire, on divise par dy, on obtient la relation : 


il = 1 
(18) x'e (t) > Met(tt)] 
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qui relie la dérivée en t de la permutation aux dérivées de x(s) aux points 
ti correspondant à t. D'après ce qui a été dit, si y = xçc(t) est un maximum 
ou un minimum de x(s), les relations (17) et (18) seront valables à droite 
de t pour un certain groupe de ti, et à gauche pour un autre groupe : et si 
tj appartient à deux groupes à la fois, la fonction tj(t) variera (en général) 
en passant d'un groupe à l'autre, (V. l'exemple au n° 22). 


19 - Venons-en à la détermination de p.(t). L'équation (10) devient, en re- 
marquant que le deuxième terme du deuxième membre manque parce que 
Mm(y) = 0 en © et que I(x< y) est plurintervalle : 

toi 


(19) L'rtnas- 5 ("pts ae 


Loi-1 


On trouve en la différenciant : 


(20) p.(t) dt = L [pttai) dtoi - p(tait) dtu-1] sOPpIX) | dti | 


c'est-à-dire le poids (élémentaire) pour x,(t) est la somme des poids aux 


points ti où x(t;i) = xc(t). = 

Ainsi, dans le cas continu, une propriété évidente pour les distribu- 
tions discontinues (v.n°15) reste valable. En divisant ensuite l'expression 
(20) par dt on obtient la solution continue 


(21) pt) =D epltf tr] 10 


celle-ci, compte tenu de la relation (17), exprime que la densité (continue) 
de pondération à attribuer à xc(t) est moyenne pondérée de la densité aux 
points ti correspondant à t, avec comme poids |t'| pour pti). La nature 
de la moyenne Pet) se trouve ainsi précisée dans les hypothèses considé- 
rées. 
20 - Montrons maintenant que l'intégrale de x(s) p(s) coïncide avec celle 
de xc(t) p.(t) dans l'intervalle a b. 

Commençons par considérer l'ensemble U des segments ai——f$ , 
dans lesquels xc(t) = constante = yi. Dans «jf; = 


a pr p(s) ds [m(y,) = fi - ai] 


Comme xç(t) = x(s) = constante = y; quel que soit s dans Ii(x = yi), si 
on multiplie le premier membre par xc(t) et le deuxième par x(s) à l'inté- 
rieur de l'intégrale, nous aurons : 


fi 
fi xe(t) p(t) dt -[. x(s) p(s) ds 


et, en faisant la somme : 
(22) xt rte) at = [ xts) pts) as 
Uu 


où I est la ''somme'' des ensembles disjoints Ii. 


Soit, alors, t extérieur à U, c'est-à-dire situé dans son complément 
V. Puisque xc(t) = x(ti) quelle que soit la valeur correspondante de ti, si 
on multiplie par xç(t) le premier membre de l'équation (20) et par x(ti) le 
terme du deuxième membre contenant pti), en intégrant ensuite sur V, on 
Aura : 


[=e pe(t) dt = 2 / x(ti) pti) dti 
v AC A TE 
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où y; est l'ensemble parcouru par ti quand t varie dans V. Puisque ti est 
fonction continue de t, croissante ou décroissante, Yi est un intervalle dont 
les extrémités sont des points T7 pour lesquels y = x(T) est maximum ou 
minimum, ou bien m(y) > 0, 


De tels intervalles Yi; (disjoints) complètent évidemment le complé- 
ment J de I dans a b : donc : 


(23) [= pe(t) dt -[ x(t) p(t) dt 
V A) 


En additionnant (22) et (23) on obtient en définitive, comme on le dé- 
sirait : 


b b 
(24) Î xc(t) pet) dt -[ x(t) p(t) dt 


21 - Des égalités(24) et (11), il résuite donc, que la moyenne pondérée Mp 
ne varie pas quand on calcule sur la permutation xc(t) avec la pondération 
p.(t) définie précédemment. 


Passons, maintenant, à une autre permutation xa(t) de x(t). Le poids 
p,(t)dt à assigner à xi(t) devra être tel que, selon les critères habituels, 
on ait pour résultat, quel que soit y 


Î p(s) ds = p (s) ds 
X<Y X<Y 


De là, par un raisonnement analogue à celui employé au n° 6 pour 
I(x< y), on déduit : 


(25) Î p(s)ds À} p,(s)ds, j) p(s)as = ] p,(s) ds 
X=y X4=Y X <y X4 <y 


Ceci posé, construisons la permutation croissante x4.(t) de x,(t), et déter- 
minons le poids p_(t)dt à lui assigner. Nous savons déjà (n° 12) que x; (t) 
est : xc(t) ; de plus, en vertu de la relation (25), le deuxième membre de 
l'équation (10) ne varie pas quand on substitue p,(s) à p(s), d'où l'on peut 
admettre que paa(t) = Pet). Donc, s(t) et xt) ont la même permutation 
croissante et avec le même poids. Comme les moyennes pondérées de x{t) 
et x(t) coïncident avec les moyennes pondérées de leurs permutations 
croissantes, et que, celles-ci sont égales, on conclut que les deux moyen- 
nes de x(t) et xi(t) seront aussi égales. En résumé, on peut dire qu'une 
moyenne pondérée est une fonctionnelle symétrique, Ce résultat ne pouvait 
se déduire directement de l'observation formulée dans le paragraphe 12, 
parce que la moyenne pondérée dex{t)n'est pas seulementune fonctionnelle 
de x(t) mais aussi de p(t) et cette fonction est modifiée quand on passe à 
une permutation x{(t). 


22 - Exemple : 


. Appliquons à un exemple - tout-à-fait simple pour éviter des compli- 
cations de nature exclusivement technique - les procédés exposés. Soit x(t) 
dans l'intervalle 2 2, défini comme suit : 


Intervalles 22 1081 


x(t) Ait 1+ 


010 FE | 2 
2=t “tn 


2 2 


La courbe de x(t) est la ligne brisée, ayant pour sommets(-2,1)(-1,0) 


(OH 2h21): 
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Pour y < 1/2 on a seulement 2 points t:, t,:; et pour y > 1/2 on intro- 


duit aussit;, t4 (coincident pour y = 1/2). Précisément : 
Ya 4, te] 
CAN VE PORT tive tot 47 sy metre hit = 22 
t=-2tt-ti=-24+2y, y= xt) = 2 Xe (t)= 1/2 


bu 2 #2 tp 2, te th 11/2 
a à ve D à 
CAEN IV Con ENErVts 2 DEV, ta — 217 
Pre 2 y; title= 25 tite =2+diy, ts Ft = 2 


nr AM DA EE 2 tta-to=-4+6y, y = xet) = ÀÈE x 176 
-10-t -2 +t Zen 4 +t 
t1 = ä to = 6  t23= 3 »t4a= 3 
le =those1/6 tte 174 
La médiane est xc.(0) = 4/6 ; les quartiles sont xç(- 1), xce(0), x«(1) 
c'est-à-dire 3/6, 4/6, 5/6. On vérifie que > | ti | = 1, À gauche et à 
droite de t = - lona, pour t.et t,deux expressions différentes en fonction 
de t ; la dérivée de +40) à sahte est 1/2, à droite 1/6 et ceci parce que 
pour t = - 1, x(t) passe par un minimum. 


La moyenne (simple) peut être calculée au moyen de x({t) ou bien de 
Æ.(t). En effet : 
+ 


4 : : 
[= HE (-1-t) a+] (1+t) dt + | ea, | ie 
2 so) 4 ë . 


= LE hél/ CLS / At 84 ES 02 


2: — 2 
Î Hits Le Zttas | État = 44007 452 
2 7 E 


Donc, la moyenne est A2 5 PE 


Passons aux moyennes pondérées, en supposant p(t) = 2 +t et en cal- 
culant p,(t) 


2 - 1 


2 +t1 +2 +t 4 - 2 
plt) = pts) [tn +p(t) te tiède £ es: 


- 1 2 
p.(t) = plts) ]tn] + ptit plts) [ti] + p(ts)t4 = 
_2ttat2 tte, 2 tts+2 +tta 4-2 4 +2 _ 
n 8 ï 3 RE 


Pour t = - l la densité de pondération est l à gauche et 7/3 à droite. 
Vérifions l'invariance du oise total 


[x (bide ASE 8 
[ra az [las za 1+7=8 
2) 


66 CARLO BONFERRONI 


Il en résulte en outre : 


2 (o] 1 
Lx) p(t) dt = [ (-1-t) (2+) dt :l (1+t) (24) dt +] AE & + 


Æ] 


2 
.l + (2H) dt=1/6+5/6 +11/6 + 16/6 = 11/2 
1 


2 1 2 
[ =trto «| LS at +] SE Lot = 1/4 +21/4= 11/2 
2 _ 1 


2 
L'une ou l'autre intégrale, divisée par le poids total, donne : 


M, MN 6: 


23 - Pour avoir la médiane, les terciles, les quartiles, etc ... de x(t) 
avec pour poids pt), il suffira de diviser la surface du diagramme de 
Y = pe(t) en 2, 3, 4, ... parties égales : si les ordonnées à diviser portent 
sur les points T,,T2 ..., les valeurs correspondantes de xe(t) donnent le 
résultat cherché. Dans l'exemple précédent, si on a p.(t) = constante = 1, 
dans l'intervalle - 2. - 1 et p,(t) = constante = 7/3 dans l'intervalle 
- 1 -2,la détermination est très facile. Pour la médiane pondérée, c'est 
par exemple : 


HR REA TETE S/7 
valeur un peu supérieure à la moyenne pondérée. 


24 - Fonction de deux variables. 


On peut immédiatement étendre les concepts et les définitions précé- 
dentes à une fonction mesurable x(u,v) de deux variables, définie sur les 
points d'une région plane (R) de mesure (de surface) R. Sur la base de la 
mesure m(y) del(x<<y) on définit les permutations x4(u,v) eten particulier 
celle que j'appellerai encore permutation croissante et qui sera une fonc- 
tion xe(t) de la seule variable t, construite sur l'intervalle 0 R par le 
procédé employé pour x({t), c'est-à-dire en posant x(t) = y pour les points 
de l'intervalle qui a pour extrémités : 


m(y) ; my) - m(y) [(y) = mes 1(x=y)| 


Il est intéressant de remarquer que de cette façon les ordonnées infi- 
nies de la courbe de x(u,v) dans un champ à deux dimensions, sont trans- 
férées, dans un champ à une seule dimension, et disposées par ordre de 
grandeur. La gradation de ces ordonnées, toujours possible quand leur 
nombre est fini même si elles dépendent de deuxindices entiers, peut donc 
s'effectuer aussi pour une distribution continue à deux variables. 


Les permutations auront la même intégrale (de Lebesgue) ; en parti- 


culier 
R 
Î[ x(u,v) du dv = Î xç(t) Ge 
(R) () 


égalité qui peut servir de définition de l'intégrale de Lebesgue et qui cons- 
titue en substance, une formule de réduction d'une intégrale double à une 
intégrale simple. 
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xç(t) une fois Construite, sa valeur pour R/2 sera la médiane de la 
double distribution de valeurs x(u,v). Au moyen de xe(t) on pourra aussi 
calculer la moyenne de x{u,v) en (R). Pour les moyennes pondérées il 
faudra déterminer le poids Pelt) dt pour xe(t), le poids p(u,v) dudv pour 
x(u,v), étant connu, en posant une condition analogue à l'équation (10). 


Enfin, on peut étendre ce qui précède àdes fonctions de trois variables 
ou plus, 


n'es 104 108h6v. 4 
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CLASSIFICATION AND ANALYSIS OF LINKED BLOCK DESIGNS 
by J. ROY and R.G. LAHA 


Un "'EQUI REPLICATE INCOMPLETE BLOCK DESIGN'' est un arrangement de 
v variétés en b blocks de k groupes chacun,k v,chaque variété apparaissant auplus 
une fois dans chaque block, et ensemble dans r blocks. 


Cet arrangement est appelé''LinkedBlockdesign''sipj=u V ix4 j=i,2, ...,b 
et 'Balanced Incomplete Block design'' si Àij =À V a RENTE 


Une condition nécessaire et suffisante pour qu'un BIB design soit un LB est que 
v = b. 


L'auteur donne ensuite la définition d'un PBIB design à m classes associées, 


L'ANALYSE INTRA-BLOCK de LB DESIGN est complètement faite, 


L'auteur donne un exemple numérique : v = 17, b=9,k=8,r=4, H = 3% 


C - CLASSIFICATION DES LB DESIGNS : 


en trois groupes principaux : l) BIB designs symetriques, 
2) PBIB designs, 
3) Designs irréguliers. 


CONDITION NECESSAIRE ET SUFFISANTE POUR QU'UN PBIB DESIGN A DEUX 


CLASSES ASSOCIEES SOIT UN LB DESIGN. 
C'est que la matrice A = ee: ce) ait une seule racine # 0 et qu'elle soit d'ordre 
n à929 

b - 1 pour la matrice d'association du PBIB design. 


an à 


AvecrA= ay à2' ay =r + py + À: Pn = As mn 
ap = À1 Pn + Az Pg - À: ns 
2 = A1 Pn + A2Pn - 2 Da 
An = LT A: p? + Aop - À2 D 


LISTE ET PLAN DE TOUS LES LB DESIGNS OUR,K< 10 


70 SANKHYA 


ON THE RECOVERY OF INTER BLOCK INFORMATION IN VARIETAL TRIALS 
by C. RADHAKRISHNA RAO 


Comrnentaires sur la méthode de ''Intra and inter block analysis'' proposée par 
l'auteur en 1947, 
METHODE Q 


On résoud les équations 


CRÉOLE 3,6 NE PARA, 


K TR. 7e k 
avec les notations habituelles, 
L'auteur fait l'analyse générale : 


Exemples : 1/ BIB 
2/ PBIB 
3/01 on introduit ici l'écriture matricielle, 


METHODE P 
Intra block analyse : 


aux équations Q = (rl -—N'N)t 


on ajoute les équations 


B = kb + Nt 
finalement on résoud les équations 
u 
P = (ks- NN° )b 
T Le 
Intra et inter block analyse : 
1! 
aux équations Q = (wri- ——— N'N)t 


on ajoute 


B - kmu = kb + Nt 


A GENERAL CLASS OF QUASIFACTORIAL AND DESIGNS RELATED 
by C. RADHAKRISHNA RAO 


DEFINITION D'UN'' QUASIF ACTORIE L DESIGN! : 
Soient v variétés, que l'on identifie avec le système suivant : 
(a X2» Xn) 


Kiss ee D: i=I, 
et b blocks de k variétés chacun tels que 


1) chaque variété est utilisée r fois 


2) les deux variétés représentées par(xi)et(yi)apparaissent dans Àc, 


blocks 
avec cj = 1 ou 0 suivant que x; = y; ou x; Yi. 


n 


p(C:, ... Cn) = (Pm; 6 d)ps: Ë 1) eo. fes, a 1) 


AVECIEMI ro lCms ils les autres = O0, 


On considère dans cet article les ‘'quasifactorial designs'' de dimension 2, 
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CONSTRUCTION DE ''QUASIFACTORIAL DESIGNS!" de DIMENSION DEUX 
1) Provenant de carrés latin orthogonaux 
a) v=pq b=q(q-1) k=p r(q-1) Au = À = 0 ,Àn= 1 


exemples numériques. 


b) v=pdrb=dq,k=p r=q, Ày=1=A0 ; Ào= 0 
2) provenant de la réunion de 2 BIB designs de paramètres 
Ve=Rp, DD, Tr, Ke À 
VAN MDI= Dr TE Er PLIS 
on obtient les designs de paramètres 


v=ipx", be="pb{ +"qbil;itr = rire k LINE OU N'a = AT A pI= AS 


DESIGNS À TREILLIS CIRCULAIRE 


Soient n cercles concentriques et n diamètres de finissant 2 n° points, si les 
cercles et les diamètres sontpris commeblocks onobtient undesign de paramètres : 


V2 nt Mbi-Mniet =ln te-12) 


l'analyse est faite en utilisant la méthode P. 
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Mcie A. M. GERVAISE 


ALTERNATIVES MODELS FOR THE ANALYSIS OF VARIANCE BY M. SCHEFFE - 


L'auteur passe en revue les principaux modèles mathématiques qui font l'objet 
de l'analyse de la variance, leu: formulation, justification et l'inférence statistique 
qu'ils permettent; cet article est semblable à celui de S.L. CRUMP (1951) ''The 
present status of variance composant analysis'' - Biometrica - Vol. 7; pp. 1 à 16 - 
Toutefois il ne le répète pas. Dans ces deux articles les modèles particuliers et 
difficiles ne sont pas traités; pour ce qui concerne ceux relatifs à l'industrie et à la 
physique, l'auteur renvoie à Kempthorne et Wilk (1953-1955) l'A series of reports 
beginning.December 1953, on models for the analysis of variance, Analysis of 


variance project, Statistical Laboratory, Iowa state college - 


THE THEORY OF DECISION PROCEDURES FOR DISTRIBUTIONS WITH MONOTO- 
NE LIKEHOOD RATIO - By S. KARLIN and H. RUBIN 


Les’auteurs généralisent et précisent les résultats de S.G. ALLEN ‘'Annals of 
Mathematic Statistic Vol. 24 (1953) pp. 195-298. Dans cet article il est montré que 
pour un test d'hypothèse composite ‘'à un côté'' relatif à une famille de distributions 
exponentielles, unedécision minimax est de la forme : Accepter l'hypothèse si x<xo 
et accepter l'alternative si x=>xo. M. Sobel ét Chernoff ‘'An essentially complete 
class of decision functions for certain standard sequential problems'' Annals, Math. 
Stat. - Vol 24(1953) pp. 319-337 ont obtenus quelques-uns de ces résultats pour la 


même classe de distributions lorsque la suite des décisions est finie. 


Dans la première partie de l'article, S. KARLIN et H. RUBIN insistent sur les 
conditions à imposer aux fonctions pertes, les densités sont limitées et étudiées du 
point de vue de leurs propriétés. Dans la deuxième partie, les auteurs établissent 
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quelques lemmes fondamentaux, notamment ils mettent en évidence les changements 
de signes qui restreignent les propriétés des densités à rapport de vraisemblance 
monotone, Lorsque le nombre des décisions possibles est fini, la suitede toutes les 
stratégies monotones dans la classe des procédés statistiques est complète (partie 
3). La quatrième partie est la détermination de la forme des stratégies de Bayes 
pour le statisticien tandis que le problème de l'admissibilité fait l'objet de la cin- 
quième partie. La sixième partie réduit cette étude des stratégies pour la nature 
aux cas de deux actions. La partie sept est larecherche d'uneclasse complète lors- 
que le nombre des actions est fini. La partie huit est l'analyse de la nature des 
stratégies de Bayes pour un nombre fini d'actions. La dernière aborde une rapide 
discussion sur la théorie de l'invariance et les conditions de monotonie étudiées 


dans l'articie, 


ON THE POWER OFCERTAIN TESTS FOR INDEPENDANTE IN BIVARIATE POPU- 
LATIONS by M.S. KONIJN - 


Soit Fxe ia distribution à deux dimensions de deux variables indépendantes Yx 
et Zxo. L'article est une étude de la distribution F1 (à deux dimensions) de deux 
variables Yx\et ZA transformées linéaires des deux premières. Soit Jo le test de 
corrélation de rang de Spearman, J, le test de corrélation de signes, J, le test sans 
distorsion de corrélation de ‘'graduation'' J, le test de corrélation ''médiale'' et R le 
test de corrélation (paramétrique) ordinaire. L'auteur étudie quelques propriétés 
des puissances de ces tests pour des alternatives liées à l'hypothèse d'indépendance 
et pour de grands échantillons. Dans ces conditions l'efficacité de J;, est fortement 
liée aux propriétés de localisation des densités de Y\, et ZN ; l'efficacité de:J,est 
souvent voisine de l'unité. 


THE EFFICIENCY OF SOME NON PARAMETRIC COMPETITORS OF THE TEST - 
t - by J.L. HODGES 


Soient des échantillons de deux distributions continues F(x) et F(x-G). Onteste 
l'hypothèse 6 = 0 à l'aide du test de Wilcoxon, Les auteurs montrent dans le para- 
graphe 1, que l'efficacité asymptotique de ce test au sens de Pitman,relativement 
à celle du t,est toujours supérieure ou égale à 0,864,.Ce résultat est encore valable 
pour le test de Kruskal - Wallis relativement au test F, Dans la deuxième partie, 
les auteurs comparent un certain nombre de notions d'efficacité asymptotique;alors 
surgissent certaines difficultés du fait que la puissance n'est pas nécessairement 
une fonctionconvexe de la taille de l'échantillon. En particulier à l'efficacité asymp- 
totique de Pitman, les auteurs opposent une nouvelle notionbasée sur la vitesseavec 
laquelle la puissance pour une alternative donnée tend vers 1, En particulier pourle 
test de signe relatif au test t et des populations normales, il est possible d'obtenir 
lorsque n—> la limite de la suite des fonctions puissances. 


ON REGULAR BEST ASYMPTOTICALLY NORMAL ESTIMATES - 
by CHIN LONG CHIANG - 


Cette étude concerne l'estimation de certains paramètres trouvés lors del'uti- 
lisation des processus stochastiques de croissance, Les distributions rencontrées 
dans ce domaine conduisent à des calculs différents et des formules complexes si 
l'on utilise les méthodes classiques d'estimation, Le butde cet article est de discu- 
ter une sous-classe des estimations envisagées par E. BARANKIN et J. GURLAND 
(1) et de donnerune méthode simple pour construire de telles estimations, Cesesti- 
mations reposent sur un nombre devecteurs aléatoires dontles distributions ne sont 
pas spécifiées. Il est démontré que, moyennant certaines conditions de régularité 
les estimations régulières et convergentes ainsi obtenues sont asymptotiquement 
normalement distribuées lorsque le nombredesvaleurs aléatoires tendvers l'infini, 


| (1) "An asymptotically Normal efficient estimators!! 
University of California publications in statistics - Vol. 1] PP. 


ANALYSE D'ARTICLES 73 


L'auteur démontre la condition nécessaire et suffisante pour qu'un estimateur régu- 
lier et convergent ait une matrice des covariances asymptotiques l'minimale'", TL 
prouve également que si une fonction f satisfait certaines conditions, pour que f(8) 
soit un estimateur RBAN de f(0) à f(0°), il est nécessaire et suffisant que Ô soit 
Ro un estimateur RBAN de 0 à 0°, (R.B.A.N. = regular bestasymptotically 
normal), 


THE LARGE SIMPLE POWER OF RANK IN THE TWO SAMPLE PROBLEM 
by M. DWASS - 


Cet article étudie la puissance (pour de grands échantillons) de certains tests 
qui utilise la méthode desrangs contre desalternatives à un paramètre pour la com- 
paraison de deux échantillons. 


Les m premières,parmi N variables indépendantes, sont supposées identique- 
ment distribuées avec comme densité Hs 0 ) ; les N - m autres ont pour densité 
f(x ,0 ). Lorsque 0 = 0, les deux densités sont les mêmes. Si AN Ne AN 


est une suite de constantes, by, » buy ... ban une autre suite; si R1, R2 ... Ra sont 
w N 


les rangs des n variables, un statistique du type an; bnr; est appelé un statis- 


1=1 


tique L.. 


La partie I de cet article caractérise la statistique de rang localement la meil- 
leure pour tester H, = 0 = 6 contre H; = 0 = 0 et voisin de 0. Moyennant certaines 
conditions de régularité, il est possible de déterminer la puissance des statistiques 
L et en particulier celle du statistique L localement le meilleur. 


Si aucune condition n'est imposée aux bn, ..bnn , il est habituellement difficile 
de déterminer si les conditions de régularité sont remplies; la partie II considère 
donc une classe spéciale de statistiques L, les statistiques L}. Pour ceux-ci, les 


conditions de régularité sont plus faciles à vérifier. Le meilleur statistique L peut 
alors être approché à l'aide des statistiques L}H. 


TABLES OF EXPECTEDVALUES OFORDER STATISTICS AND PRODUITS OF OR- 
DER STATISTICS FOR SAMPLES OFSIZE TWENTY AND LESS FROM THE NOR- 
MAL DISTRIBUTION by D. TEICHROEW 


Des tables des moyennes, variances et covariances des statistiques d'ordre 
provenant d'échantillons de 10 ou moins ont été données avec 5 décimales par GOD- 
WIN 'l'On the estimation of dispersion by linear systematic statistics'' Biometrica 
Vol. 36 (1949) - pp. 92-100. Dans cet article sont tabulées les valeurs moyennes, 
les écarts-type des statistiques d'ordre et produit de deux statistiques d'ordre pour 
des échantillons de 20 et moins avec 10 chiffres significatifs. De plus des fonctions 
nécessaires au calcul de ces mêmes valeurs moyennes à partir de grands échantil- 
lons sont fournies avec 25 chiffres significatifs. 


ESTIMATION OF LOCATION AND SCALE PARAMETERS BY ORDER STATISTICS 
FROM SINGLY AND DOUBLY CENSORD SAMPLES - PART. I - THE NORMAL 
DISTRIBUTION UP TOSAMPLES OF SIZE by A.E.SARHAN et B.C.GREENBERG. 


Des échantillons censurés du type Il font l'objet de cet article; la taille de l'é- 
chantillon est connue mais les observations de plusieurs valeurs extrêmes man- 
quent. Les échantillons simplementcensurés sont ceux pour lesquels fontdéfaut seu- 
lement les r, plus petites observations ou les r, plus grandes; ils sont doublement 
censurés lorsque cesr,etr, valeurs manquent, La partiel fournit des tables permet- 
tant l'estimation de la moyenne et de l'écart-type d'une distributionnormale à partir 
d'échantillons simplement et doublement censurés. (taille des échantillons n < 10). 


Les estimations des paramètres utilisés pour construire les estimateurs systé- 
matiques linéaires sont obtenues en rangeant par ordre de grandeur croissante les 
éléments connus de l'échantillon et en appliquant la méthode des moindres carrés 
pour obtenir la meilleure combinaison linéaire de ces paramètres. Les coefficients 
ainsi calculés font les estimations sans distorsion et à variance minimum. La mé- 
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thode du calcul utilisé est celle de Gupta avec quelques modifications (A.K. GUPTA 
Estimation of the mean and standand deviation of a normal population from a cen- 
sored sample'' Biometrica Vol. 39 (1954). 


A WAITING LINE PROCESS OF MARKOFF TYPE - 
by A.B. CLARKE - 


Les processus des queues du type de Markoff font l'objet de cet article. Le 
traffic des ''arrivées!'! est du type de Pearson. Les paramètres sont fonctions du 
temps. La recherche d'une solution exacte pour l'obtention de la distribution de la 
longueur de la file d'attente fonction du temps se réduit à larésolution d'une équation 
de Voltera. Lorsque le rapport des paramètres relatifs aux entrées et sorties est 
constant, cette équation se résout explicitement et on peut obtenir la distribution. 
Apartir de cette solution, on peut étudier le processus pour des grandes valeurs de 
t, particulièrement dans le cas instable lorsque l'intensité est supérieure à 1. 


ON THE NORMAL APPROXIMATION TO THE HYPERGEOMETRIC DISTRIBUTION 
by W.L. NICHOLSON 


Dans cet article, l'auteur fournit une nouvelle approximation de la somme des 
termes d'une distribution hypergéométrique; c'est une généralisation de l'approxi- 
mation normale donnée par Feller pour la distribution binomiale., Lorsque la dis- 
tribution est asymétrique cette approximation est une amélioration par rapport aux 
résultats classiques. L'auteur en déduit des limites inférieures et supérieures pour 
la distribution hypergéométrique ce qui permet d'évaluer l'importance de l'erreur. 


CHARTS OF THE POWER OF THE F TEST BY M. FOX 


Les coordonnées sont f,et f, nombres de degrés de liberté des numérateurs et 
dénominateurs du statistique F; les cartes sont construites pour f3 = 0.5, 0.7, 0.8, 
0.9 avec &æ = 0,001 et & = 0.05. Les courbes sont valables pour des valeurs de 


@ = constante ou æ@ = V66/(f;+1)a?. et 8h est le numérateur de F, 


Ces cartes sont destinées à répondre à la question suivante : Quelle combinai- 
son de f, et f, doit-on utiliser de manière à ce que la puissance ait un niveau fixé p? 


ESTIMATING THE PARAMETERS OF A TRUNCATED GAMMA DISTRIBUTION 
by D.G. CHAPMAN 


Dans cet article, l'auteur publie une table permettant de simplifier l'estimation 
des paramètres d'une fonction gamma incomplète ou distribution du type III. La 
nouvelle méthode ainsi suggérée peut être utilisée pour un certain nombre d'autres 


distributions tronquées, que la coupure porte sur le centre ou les extrémités de ces 
distributions. 


APPROXIMATE UPPER PERCENTAGE POINTS FOR EXTREM VALUES IN MULTI- 
NOMIAL SAMPLING by R.M. KOZELKA 


Etant donnée une distribution k - multinomiale avec des probabilités égales 
pour chaque catégorie, on cherche la probabilité de la fréquence la plus grande dans 
chaque catégorie, L'article alors donne une approximation asymptotique simple des 
centiles supérieurs de cette distribution. Une table fournit les points 0,95 et 0,99 
calculés à partir de cette approximation pour k= 1 (1) 25 est jointe une table pe 
mettant de comparer ces valeurs à celles réelles, lorsque k = 2, 4, 5etn= 3(Da2 
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AN EXTENSION OF THE KOLMOGOROFF DISTRIBUTION 
by J. BLAKMAN 


Soit X4, Xos ..., Xns Xy ... Xndes variables aléatoires indépendantes avec une 
distribution commune F(x) continue. Soit Fn(x) la distribution empirique construite 
à l'aide de x, x, ..., Xn, Gn(s) celle construite à partir de x, ...xn. L'auteur 


calcule les valeurs exactes de Pr [ - y Fan (s) - Gn (s) x pour tout s] et 
Pr [- y<F(s) - F,(s)<Zx pour tout s]ainsi que les deux premiers termes des 
séries asymptotiques lorsque n est grand. 


ON THE SIMULTANEOUS ANALYSIS OF VARIANCE TEST - 
by K.V. RAMACHANDRAN 


Dans l'analyse de la variance les différents tests decomparaison des moyennes 
ne sont pas indépendants, La théoriedes tests simultanésde l'analyse de lavariance 
et son utilisation pour certains problèmes ont été données par CHOSH''Simultaneous 
tests of linear hypotheses by the methodof analysis of variance''(unpublished 1953), 
L'auteur n'envisage que certains cas particuliers et montre que la puissance du 
test à des propriétés de monotonie. 
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